日水转:培养基和补料中生物添加物的多元分析

发布时间:

2022-11-16

作者:

日水培养基


生物药工业化生产中,生长培养基配方中通常含酵母提取物和蛋白胨等添加物。尽管政策鼓励公司使用化学限定性培养基以减少哺乳动物细胞培养工艺中的变量,许多微生物和哺乳动物细胞培养工艺中仍继续使用生物添加物作为其生长培养基配方或补料。据Sheff ield Bioscience (Kerry, Inc.)报道,已获批的哺乳动物细胞–衍生的生物治疗产品中至少有六成在生产中使用了生物添加物。
 
工艺开发过程中,难以确定哪种添加物适合于某种特定应用,因为添加物的复杂组分和多样性。多变量分析(MVA)技术越来越广泛地应用于帮助公司了解他们的生物制药产品和生产工艺的复杂性。  
 
技巧包括基于统计的工艺建模、传感器校准和工艺可比性。
 
多变量分析(MVA)技术本质上是一种统计回归技术,试图通过捕捉新的正交变量或称为主成分(PCS)的可变性来对实际变量的可变性作出解释。相关实际变量之间的相关性允许使用数量较少的主成分来捕捉建模和作出预计,从而对更大量的数据集的原始信息作出分析。
 
这里,主成分分析法(PCA)用于对来自六十五种无动物成分(ACF)生物添加物的组合数据变化,进行数据捕获和建模。由此产生的模型用于研究两种生物添加物的批间变化,并对市场上的新产品进行评估。本文展示定量结构-活性关系(QSAR)方法来研究组分与培养表现和产品蛋白含量之间的关系。 
 
这里推荐定量结构-活性关系(QSAR)为基础的方法,使用主成分空间的因子设计来评价添加剂组成和细胞培养表现之间的联系。由生物添加物衍生的主成分分析法(PCA)分数和由定量结构-活性关系(QSAR)方法选择出来的生物添加物的细胞培养物的模拟性能数据组成的训练集,被用来创建偏最小二乘(PLS)模型。然后PLS模型可以用于预测不属于训练组的生物添加物的性能。
 
数据源和数据汇编
145个生物添加物的化学成分数据,可从公开来源获得,由OxoD,Becton Dickinson和Sheff ield Bioscience公布。
 
这些数据代表了每种生物添加物的典型组成,并且可以被认为是从许多生产批次、子样本或分析中得出的平均值。每个生物添加物的化学组成在电子表格中被编辑并注释以方便后续的分析。注释里包含供应商、原材料来源、产品类型、消化法和ACF状态(表1)。在供应商之间的测量单元不同的情况下,这些测量单元被标准化,使得数据集具有可比性。选择65个无动物成分(ACF)生物添加物组成的训练数据集,每个数据集有59个变量来描述每种生物添加物的物理化学数据、分子量分布和自由氨基酸总量。表2列出了这里使用的变量。 
分析方法
使用SIMCA P 11.5(MKS UMeMeX,瑞典)用于错误筛选、PCA和PLS分析。从编译数据集中选择ACF生物添加物以构建PCA模型。80%以上的产品的变量可用于分析。在分析前用中间定心和单变量定标对所有变量进行预处理。
 
结果
1市售无动物成分(ACF)的主成分分析(PCA)
生物添加物:总计59个变量被用来描述每种无动物成分(ACF)生物添加物(共计65种),以建立主成分分析模型。结果模型捕获了67%的数据集变动,来自于四个PCs。图1显示了PCs 1, 2和3的分数曲线。这些图显示了添加剂组分之间的关联。在左侧,酵母提取物倾向于与ACF共混物沿着PC1(X)轴分离,而ACF共混物和大豆蛋白胨倾向于沿着PC2(Y)轴分离。在右侧,大豆蛋白胨和ACF共混物倾向于沿着PC3(Y)轴分离。
日水转:培养基和补料中生物添加物的多元分析
图2显示了PC1/PC2(左)和PC2/PC3(右)的加载图,总结了PC1和PC3之间原始组成变量的关系。可变标记根据可变类型着色:生理化学(CHE);游离氨基酸(FAA);分子大小分布(SIZ);和总氨基酸(TAA)。PC1与个别和总的游离氨基酸(FAA)呈正相关,与氨基氮百分比(%AN)呈正相关。中、高MW分布与PC1呈负相关。正如预期的那样,更高的水解度(AN/TN)是与增加的低范围MW种类和较高的游离氨基酸(FAA)含量相关。如图1的左侧面板所示,酵母提取物倾向于沿PC1与ACF共混物分离,表明酵母提取物是与较高氨基氮百分比(%AN)和游离氨基酸(FAA)相关,具有较低范围的MW种类。PC2与总氨基酸(TAA)呈正相关,PC3与中范围MW种类增加相关,与低范围MW种类呈负相关。ACF共混物和大豆蛋白胨是沿着PC2分布,表明变化的主要原因是由于总氨基酸(TAA)含量的变化。大豆蛋白与ACF共混物沿PC3分离,表明那些蛋白胨肽与中范围MW种类的增加相关。
 
2ACF生物添加物批量差异的PCA分析
供应商网站提供的来自HyPep1510大豆蛋白胨和SHIFCHO PF ACF共混物组分的多批次数据。这些数据被编译成如上所述的PCA模型。HyPep1510和SHIFCHO PF ACF共混物的批间比较数据被用作预测集,以比较在PCA模型中捕获的典型参考数据。图3比较每一个具有典型产品--参考数据(红色圆圈)的产品批次的预测得分。因为预测得分在PCA模型的t-测试圆形范围内,产品批次内的可变性被很好地建模。尽管所有批次都是在指定范围内制造的,但大量的批间变化是清晰可见的。 
日水转:培养基和补料中生物添加物的多元分析
在图3中,SHIFCHO PF批次被安排在一个不同的组中,在典型的参考数据(倒置三角形)下面。NVA #1165批次位于远离主组的位置和典型的参考数据作为数据缺失的结果。剩余的批次沿着PC2(y)轴分布,表明总氨基酸(TAA)含量的一些变化。图4左侧面板显示了组合批(NVA #1165除外)与典型参考数据批之间的差异,。不同的SHIFCHO PF批次的平均总氨基酸(TAA)含量比典型的参考数据显示的总氨基酸(TAA)含量要低。特别地,SheffCHO PF批次通常具有较低的总谷氨酸、丝氨酸和缬氨酸,比典型参考数据报道中的总半胱氨酸含量更高。
日水转:培养基和补料中生物添加物的多元分析
图4的右侧显示,与典型参考数据相比,半胱氨酸含量在所有批次中的含量都要大五倍多。从图4的左侧也可以清楚地看出,虽然典型参考数据和批次之间的差异是清楚的,但总的游离氨基酸(FAA)不变。
 
图3中,HyPep1510批被定位在一个单一的组中,其中包括典型的参考数据。该组沿PC1(X)轴分布,表明游离氨基酸(FAA)有一定的可变性。贡献图的研究比较了典型参考数据与HyPep1510批次的平均值之间的差异(图5)。 
日水转:培养基和补料中生物添加物的多元分析
在图5的左面板中绘制的贡献权重在批次和参考材料之间没有显著差异。与参考物质相比,许多单个氨基酸的实际总氨基酸(TAA)含量减少。然而,在新的HyPep1510批次中,游离酪氨酸含量确实升高。图5的右侧显示,与典型的参考数据相比,HyPep1510批次中游离酪氨酸含量是变动很大。在10个HyPep1510批次中,有六个批次显示游离酪氨酸含量增加了两倍多,与典型参考数据批相比。目前没有关于使用这些批次的细胞培养增长和产率的数据,因此,无法确定多批次生物添加物中的变化是否具有生物学影响。批间生物添加物的变化,对哺乳动物细胞生长和单克隆抗体产率有很大影响。如果对多种生物添加物在多批次中的培养性能进行评价,就有可能预测批间变化对细胞培养生长和产率的影响。然后可以使用以下详细描述的PLS建模技术,将成分变化与培养性能和/或产品质量属性关联起来。
日水转:培养基和补料中生物添加物的多元分析
3商业化生物添加物的PCA分析
随着新产品不断面市,生物添加物用于供应细胞培养和微生物发酵应用的商业市场是极具竞争力的。当供应商提供了足够而适当的组成数据,这样的新产品可以使用PCA模型进行快速比对。数据库中,有Solobia生产的10种和Organotechnie 生产的13种添加剂添加剂的组成成分数据。单位已按材料和方法中的描述标准化。新的数据集被导入SIMCA,作为预测集与PCA模型比较。
 
图6是将新产品的预测得分与数据库中所有145种产品的预测得分进行比较的3D图。该图显示,在Hotelling T 2椭球区内捕获了许多添加剂,包括新产品。许多位于 Hotelling T 2 区域外部的产品是动物来源,沿着PC1和PC2轴导出和分布。
Organotechnie的产品位于 Hotelling T 2 区域,正如预期的那样,主要包含非动物衍生产品。然而,Solobia的产品-马铃薯来源的蛋白胨和麦芽提取物-位于 Hotelling T 2 区域外,表明这两种添加剂与其他添加剂有明显不同。马铃薯蛋白胨与模型平均值(不包括在这里)比较,显示马铃薯蛋白胨的较高总半胱氨酸和苏氨酸的水平。这些差异是否转化为生物影响尚待确定。
 
 
4使用定量构效关系QSAR将生物添加物成分与培养性能联系起来
许多技术已被用于选择和优化细胞培养和微生物生长培养基的生物添加物。有供应商报告了基于析因设计的培养基优化技术,已发展为市售工具包。本文推荐一种替代的多元建模方法,使用定量构效关系QSAR将生物添加物成分和培养性能联系起来。QSAR已广泛应用于药物开发中,用于筛选肽类药物。但据我所知,生长培养基的开发和优化是该技术的一种新应用。
 
65 种ACF生物添加物的组成变化预先已在PCA模型中捕获。主成分定义为正交,可用于析因设计实验,每个主成分为一个设计因子。表3展示具有一个中心点的两级三因子设计的设计点,其中每个因素都是来自主成分分析模型的主成分。每个设计点通过匹配其在PCA模型的主成分空间中的位置而与生物添加物相关联。对于这种设计,不可能将中心点精确地与给定的生物添加物相匹配。然而,在PC3的中心点不匹配,这比PC1中变化的占比少得多,所以PC1不是关键的。
 
模拟细胞培养性能数据被用来证明QSAR方法,因为在设计中单细胞系生长使用每个生物添加物的信息目前难以获得。对于细胞培养实验,QSAR方法假定类似浓度的生物添加物在接种前添加到基础培养基中,或作为培养期间的补料。最终的产品浓度(蛋白含量)和完整活细胞(IVC)产出变量直接使用微软Excel电子表格中的公式1和2从化学成分数据中模拟。在这些方程中使用的组成变量由化学成分数据集随机生成。为简单起见,蛋白含量和完整活细胞(IVC)均使用具有相同变量集的线性方程模拟,假设没有变量交互。选择每个变量的指标,以提供与已发表文献中相似的蛋白含量和完整活细胞(IVC)值。通过以±10%标准偏差添加人工噪声,产生每个输出变量的一式三份。每个设计点的PCA得分和表4中的一式三份蛋白含量和完整活细胞(IVC)值被用于拟合PLS模型。得到的三要素模型里R2Y=0.9,Q2=0.81。
 
图7显示了比较细胞培养性能数据和PLS模型对蛋白含量和完整活细胞(IVC)值的预测的等效图。这两个图显示出预测和模拟数据之间良好的一致性。等效图中回归系数(R2)的差异表明蛋白含量模型相关性优于IVC模型相关性。这些差异是成分变量的相对权重函数,用于模拟蛋白含量和完整活细胞(IVC)值。与PC1、2和3(图2)强烈相关(负荷)的成分变量对蛋白含量和完整活细胞(IVC)值有很大影响。来自PCA得分值的PLS模型预测,而不是来自原始成分数据,证实了PCA模型从化学成分数据捕获充分的信息以预测蛋白含量和完整活细胞(IVC)值的能力,源于QSAR方法且使用PLS模型。未被用作训练集的一部分的数据库里的剩余生物添加物,PLS模型可以用来预测其培养表现。
 
图8中的3D评分图显示了数据库中,剩余生物添加物对应的蛋白含量和完整活细胞(IVC)值的预测的范围。在这个例子中,PC1和PC2的阳性得分值更高的生物添加物,预计会有较高的目标蛋白含量和完整活细胞(IVC)值。
 
MVA的一种新应用
这项工作表明,PCA建模可以用来解释,用于细胞培养或发酵培养基的ACF生物添加物的化学组成。在65类 ACF生物添加物的组成数据65%的变化可以用PCA模型来解释。正如预期的那样,PCA模型表明,生物添加物的成分主要在游离氨基酸(FAA)含量(PC1)中变化显著。总氨基酸(TAA)含量在很大程度上独立于游离氨基酸(FAA)含量,因为总氨基酸(TAA)参数与PC2密切相关,而游离氨基酸(FAA)与PC1密切相关(图2)。评分图表明,酵母提取物游离氨基酸(FAA)成分比ACF共混物蛋白胨游离氨基酸(FAA变化更大。这种差异反映了大豆蛋白胨生产过程中可以实现的更高程度的差异控制,比起使用酵母提取物。
 
对Kerry Bioscience 生物添加物(Sheffield HyPep 1510 and SheffCHO PF)的多批次组成分析与PCA模型进行比较,该模型包含每个产品的典型参考数据(图3)。虽然PCA模型很好地代表了这两种产品的批次变化,当检测数据与PCA模型进行比较时,还是发现一些批间差异。HyPep1510的典型参考成分代表了测试批次。在总氨基酸(TAA)变化和游离氨基酸(FAA)酪氨酸含量(图5,左侧)中发现了一些微小的差异,后者是典型参考成分(图5,右)的两倍。SheffCHO PF批次PCA评分与典型参考组分有一定差异,与典型组分分离(图4,左)。这些小的差异归因于总氨基酸(TAA)含量的差异,特别是总半胱氨酸、总丝氨酸和总氨基酸(TAA)。PCA模型确定批次数据中总半胱氨酸含量比典型参考数据大五倍(图4,右)。因为游离氨基酸(FAA)含量和理化数据变化不大,锁定在肽中的总氨基酸(TAA)含量差异的生物学相关性是未知的。其影响应取决于培养物分解多肽的能力,多肽分解能力依赖于细胞系和培养生长特性。
 
PCA提供了一种简单、直观的方法来评估生物添加物的化学组成中的多元差异。它还允许快速识别大量批间差异的根本原因。确定观察到的批次变异是否与生物学相关,需要额外的培养数据。类似的方法被用来评估批次差异和评估新产品的组成。这些新产品将包含在PCA模型训练集的未来版本中。将Solobia和Organotechnie生产的新型生物添加物使用PCA模型进行了比较。正如预期的那样,PCA模型很好地代表了许多新产品的预测得分。两种产品(麦芽提取物和马铃薯蛋白胨)在PCA模型的 Hotelling T2 极限之外轻微下降,提示马铃薯蛋白胨一个很好的主题,来测试成分差异是否造成不同的培养行为。
 
基于QSAR的方法可以将PCA模型中捕获的化学成分数据与培养性能相联系。由于PCA模型的轴是正交的,因此可以使用基于统计的析因设计实验来评估代表训练集的生物添加物的子集。PLS回归模型被用于将PCA得分与模拟的培养性能相联系。所得到的结果模型使得有可能确定产品差异或批次差异是否与被评估的细胞系生物学相关。
 
为了将QSAR方法应用于新的细胞系,培养物可能生长在含有不同生物添加物的基础培养基中。但是必须注意由于适应新的条件而不是生物添加物的影响而导致的改进。另外,添加剂的使用对培养性能的影响可以用一致的补料策略来评价。这种策略通常涉及在培养达到细胞密度峰值后每隔一段时间补料。然后可以在固定时间间隔往培养体系里添加由表3所示的生物添加物制成的固定量的补料。
 
基于QSAR的每一个新细胞系的模型也将提供一个机会,快速评估剩余生物添加物在数据库中的影响,以及细胞系是否具有确切的营养需求。
 
为了简化QSAR的这一应用,使用标准析因设计选择了生物添加物的子集。有建议表明,标准析因设计不能有效地映射由PCA模型捕获的多元空间。他们推荐使用D-最优实验设计,可对多元空间提供更有效的覆盖。这样的设计使用计算机算法来从一组固定条件中选择一个子集,来有效地覆盖多元空间。此外,这种设计还可以适用于使用不同浓度的生物添加物。
 
PCA用于分析从145个生物添加物较大的数据集里得到的65种ACF生物添加物的子集。已有更大的子集被分析,这里没有报道。随着新的生物添加物或额外的分析变得公开可用,数据集将每年更新一次。
 
本文描述的方法可用于快速评估新的细胞系。细胞系在大多数商业可用生物添加物下的的性能可以被预测,通过使用大量减少的生物添加物的子集开展一系列实验。该子集可以使用实验设计(DOE)方法来选择,例如析因设计或D-最优设计。随着新的生物添加物的商业化可用,可以使用QSAR- PLS模型法快速预测细胞系的性能。
 
 
参考来源:Ronan.D.O'Kennedy.Multivariate Analysis of Biological Additives for Growth Media and Feeds.      
日水培养基qdrishfui.cn