迈向生物制药工艺的数字孪生:概念与进展

学术   2024-11-24 10:47   湖北  

摘要:数字孪生(DT)的能力以及它们在各个行业中展示的成功引起了生物制药制造领域的极大关注。实现数字孪生可以帮助降低成本、提高生产力、保持高质量和恒定的产品质量,并满足质量由设计(QbD)指南。尽管如此,数字孪生的发展仍处于起步阶段,并且在生物制药中很少报道集成的数字孪生。为了进一步推进数字孪生的发展,本章概述了生物制药制造中数字孪生所涉及的关键组成部分的当前状态。目前可用的数字孪生开发软件、用于数据采集和信息通信的过程分析技术(PATs)、构建数字复制品的各种建模策略以及物理和虚拟工厂之间的集成都进行了全面审查。

1.引言

数字孪生(DT)的概念可以追溯到2002年,当时密歇根大学的格里夫斯博士首次提出了“产品生命周期管理(PLM)的概念理想”。自数字孪生概念诞生以来,这一术语随时间逐渐演变,但其基本思想几乎没有改变。最广泛接受的解释来自Glaessegen和Stargel,他们认为数字孪生是对复杂过程的多物理、多尺度和概率模拟的结合,利用物理数据、传感器和模型来反映其相应物理孪生体的行为。一个完整的数字孪生由三个关键要素组成:一个物理组件,它目前存在于或将存在于物理世界中(“物理孪生”),一个存在于虚拟中的虚拟/数字部分(“数字孪生”),以及两个组件之间自动化的数据和信息交换(“数字线程”)。通用电气(GE)在专利申请中记录了第一个完全集成的DT商业应用演示,其中开发了“Predix”平台,用于生成DT以提供历史和实时过程信息,并运行数据分析和优化。然而,从实际应用的角度来看,简化或部分DT对行业更有利,因为它在实际生产过程中更容易实现。特别是,数字影子是简化的数字孪生概念之一,其中只有从物理到数字组件的单向流动,但没有反向数据通信的通道。由于物联网(IoT)、工业4.0技术、高级数据分析和人工智能的快速发展,数字孪生最近越来越受到关注。一个完整的数字孪生可以通过构建实时数据及其底层元信息之间的依赖关系网络,全面而全面地理解过程。具体来说,建立DT为实现制造实践的网络物理集成提供了一种有效方式,这有助于获取不同规模和地点的所有可访问过程信息,并实现与物理过程控制系统的实时信息通信。通过数字对象如过程分析和优化,可以开发和更新与物理组件数据同步的体内过程模型,为实际程序提供指导,并进一步提高整体效率和降低操作和维护中的风险。总的来说,数字孪生的应用已经证明了它们在促进遥感、实时监控、数据采集、信息交换、过程可视化和过程知识提取方面的能力。集成的DT已经被应用于包括航空航天、半导体、能源生产、智能产品制造、汽车运输和医疗保健在内的各个行业。

过去几年,生物制药市场经历了巨大的增长,以及欧盟和美国监管机构对生物药物的批准。目前,生物制药行业面临着加快生物产品开发的压力,特别是由于COVID-19大流行。然而,资源密集型的生物过程开发总是伴随着高昂的制造成本,这使得生物治疗剂对相当一部分人口来说是无法获得的。为了在满足质量管理和文件要求的同时增加生物制剂生产,过程变得越来越复杂和强化,例如从简单的分批生物反应器转向更复杂的灌注过程。这种转变增加了生物过程的复杂性和需要监控的过程变量数量。此外,FDA引入的质量由设计(QbD)倡议要求在过程设计中考虑产品质量,这推动了生物制药行业更深入地了解生物过程和生物产品之间的联系。在生物制药制造中实施数字孪生可以帮助加快过程开发,同时减少执行时间和资源密集型实验的工作量。实现DT将允许通过PATs进行实时监控,预测关键质量属性,识别设计空间,并进行过程优化,以提供实时反馈并指导操作程序。如今,随着仿真平台的发展和生物药物市场的快速增长,生物制药公司一直在努力在过程开发和商业制造中应用数字孪生概念。先进的计算硬件扩展了建模能力,允许更快、更可靠的模型构建。为了加速过程放大和减少所需的实验,辉瑞公司构建了一个两相生物反应器计算流体动力学(CFD)仿真,以预测从小规模到大规模生物反应器内的传输和流体动力学。他们的GPU工作站允许并行计算,可以在有限的时间内完成大量仿真,并排除不理想的物理条件。生物制药公司打算与数字化转型公司合作构建他们的数字孪生系统。例如,葛兰素史克(GSK)与西门子和ATOs合作,通过构建实时疫苗制造仿真平台来实现数字孪生的操作化。该项目旨在缩短开发时间并优化其疫苗产品的质量。此外,BioNTech还与西门子合作,通过应用自动化和数字化技术,将他们的设施数字化以生产COVID-19疫苗,并将转型时间从1年缩短到5个月。赛诺菲宣布与达索系统合作,以使用他们的3DEXPERIENCE平台来可视化和优化操作活动。合作涵盖了端到端的数据处理系统、虚拟操作、过程开发放大和生产工业化。从上述例子中,很明显数字孪生平台包含关键组件,包括强大的建模平台、数据采集和集中的数据处理系统。还应该包括虚拟工厂和物理工厂“通信”的控制策略。本章回顾了市场上现有的数字工业化软件,并讨论了生物制药数字孪生开发的建模方法和PAT工具。

2.当前可用于数字孪生开发的软件

数字孪生系统包含一个物理工厂和一个虚拟工厂,虚拟工厂从物理工厂动态接收数据,以实现实时监控、过程分析、优化,并将信号发送回物理工厂以指导或执行操作。虚拟工厂接收过程数据、元数据、客户反馈、市场需求、投资计划,并为物理工厂选择执行策略。因此,设计了数据采集和数据存储系统、建模和分析软件、控制以及数字/云平台来实现这些任务,如图6.1所示。

图 6.1 数字孪生不同组成部分的示意图

2.1.数据流和管理

在生物制造中,获得了高维度的异构数据。一般来说,有两种类型的数据:时间序列数据和基于事件的数据。在细胞培养过程中产生的pH值、温度和搅拌速度传感器数据可以动态生成,代表时间序列数据。基于事件的数据指的是触发器、批次报告和警报,这些数据对批次质量和操作活动也很重要。数据可以通过传感器、执行器、控制设备获得,例如可编程逻辑控制器(PLC)或比例-积分-微分(PID)控制器,或在线和离线测试设备,如光谱学、BioProfile® FLEX2、高效液相色谱(HPLC)。为了将数据从传感器或不同的测量设备传输到其他机器或接口以进行可视化和计算,开放式平台通信(OPC)服务器和消息队列遥测传输(MQTT)是两种广泛使用和占主导地位的方法。OPC的最新版本是OPC统一架构(UA),它扩展了OPC与不同类型平台的兼容性。其他方法如机器人操作系统(ROS)和数据分发服务(DDS)也是可用的。OPC UA的一个好处是它支持广泛的数据类型,包括语义数据。与MQTT相比,OPC UA允许远程过程调用(RPC)。另一方面,MQTT具有服务质量功能,而OPC UA不包括此功能。OPC服务器或MQTT代理可以连接到OPC客户端或订阅者。这包括数据管理和存储系统,如电子实验室笔记本(ELN)、实验室信息和管理系(LIMS);控制系统,例如监督控制和数据采集(SCADA)、制造执行系统(MES)、分布式控制系统(DCS)、人机界面(HMI)。服务器还可以连接到数据历史记录平台进行实时监控。数据历史记录器,如OSIsoft PI,以逻辑方式集中不同的数据,特别是基于云的数据历史记录器可以存储大量数据,并可以与其他软件集成以进行监控和分析。图6.1显示了一个简化的数据流,该数据流集成了物理和虚拟工厂。

2.2.过程建模软件

不同类型的建模软件为数字孪生在数据分析、操作指导和过程优化方面提供了广泛的能力。构建模型和对单个单元操作和体内实验进行数据分析,在过程开发阶段节省了成本和时间资源。此外,流程图模型的开发为行业构建集成的数字孪生系统带来了机会。近年来,针对生物制药操作提供了特定的过程模拟软件工具。来自过程系统企业(西门子PSE)的gPROMS FormulatedProducts提供了生物加工库,用于构建批处理和连续生物制药制造中的单元操作,包括生物反应器、色谱、膜过滤和冻干。用户可以选择内置的机械模型或自定义方程以适应他们的特定过程。该软件包含参数估计、敏感性分析和优化包,用于场景分析、放大和操作优化。gPROMS可以与西门子STAR CCM+或ANSYS Fluent软件集成,这在生物反应器仿真中特别有用,以捕捉过程的流体动力学特性。尽管它尚未应用于生物制药制造,但gPROMS Digital应用程序平台和运营卓越解决方案提供了集成的软件框架,用于数据交换、过程监控、软传感和优化。

SuperPro Designer(位于美国新泽西州斯考克平原)和BioSolve(Biopharm)是静态建模仿真工具,能够捕捉生物制药制造中的质量平衡、操作参数、设备和调度。这两个软件工具广泛使用的功能之一是早期决策的经济分析。这些软件平台可以通过估算商品成本来评估不同类型操作策略(过程周期、持续时间和生产率)在批处理、连续或混合操作模式下的表现,从而支持选择最具成本效益的过程。SuperPro Designer能够与SchedulePro集成,提供劳动力、设备、材料和公用事业信息,以减少操作停机时间,并为目标过程提供详细计划。

使用计算流体动力学(CFD)可以帮助理解复杂的多相系统,包括生物反应器、色谱、超滤和透析。这种类型的模型通常专注于单一单元操作,并产生用于过程理解、设备选择和放大活动的高保真模型。Ansys Fluent(Ansys, Inc., 宾夕法尼亚州卡农斯堡)、COMSOL Multiphysics、OpenFoam等软件工具用于生物制药行业的CFD仿真。COMSOL基于有限元分析(FMA),可以用于同时解决多物理现象。它包含模型构建器、应用构建器和模型管理器功能,允许用户自定义模型构建,将模型转换为应用程序并归档模型。COMSOL已用于上游和下游分析,以比较不同的搅拌器几何形状,模拟生物反应器中的流体动力学机制,并描述色谱中蛋白质吸附曲线。Ansys Fluent也是用户友好的CFD仿真软件,允许构建高级物理流体动力学模型。它被用来理解氧气质量传递,提供剪切和混合在生物反应器中的见解,并支持放大。它还用于预测过滤过程中的流体行为和压力曲线。Ansys Fluent在2022年7月发布的最新版本包括GPU技术和开源可访问性,显著减少了计算时间并提高了仿真灵活性。此外,Ansys还提供Ansys管理的云服务,允许在Web客户端或应用程序上上传和可视化Ansys Fluent结果。OpenFOAM是一个开源的、基于C++面向对象的CFD仿真库,可在Linux、macOS和Windows系统上运行。该软件高度可定制,源代码可用。仿真通过文本文件配置,与其他仿真软件工具高度兼容。OpenFoam的一个缺点是没有图形用户界面,这给初学者带来了陡峭的学习曲线。

生物制药开发和制造倾向于从材料和过程中产生大量信息,特别是随着PATs和高通量自动化操作的发展。为了解释光谱数据和提取信息,统计和数据分析对于监控关键过程属性(CQAs)和关键过程参数(CPPs)是不可或缺的。有几种软件可以帮助完成这项任务。它们中的许多,如JMP、Unscrambler、SIMCA不需要编码方法的专业知识,并提供用户友好的平台。这些软件的功能包括实验设计、线性和非线性回归、多变量分析,可以用来在大量参数中选择CPPs,并将CPP和CQAs相关联,以实现实时监控和放大。例如,Kirdar等人使用SIMCA-P+为2L规模和2000L规模的生物反应器构建偏最小二乘回归(PLS)模型,以了解规模变化时细胞性能的变化,并在制造过程中执行批次控制图以进行故障诊断。Clavaud等人使用Unscrambler软件,应用PLS方法和过程近红外光谱数据来监控生物反应器操作过程中的渗透压、葡萄糖、蛋白质滴度和细胞密度。作者还应用主成分分析方法来理解批次间变异性。使用JMP可以创建交互式可视化仪表板以进行实时过程监控。Unscrambler和SIMCA可以连接到平台,如Aspen Process Pulse和SIMCA在线以实现相同的功能。除了上述软件之外,建模人员还可以使用MATLAB(MathWorks, Inc., 英国剑桥)和Python来处理数据并构建不同的单元操作in-silico。例如,Ding和Ierapetritou使用MATLAB模拟多柱周期性逆流色谱,并应用基于替代的可行性分析来获得操作的设计空间。Whelan等人使用MATLAB和Eigenvector PLS工具箱作为化学计量学数据分析工具来处理拉曼光谱数据,并实时监控补料批生物反应器中的葡萄糖、谷氨酰胺、谷氨酸、乳酸、氨和细胞密度。Weilandt等人建立了Python中的符号动力学模型(SKIMpy)工具箱,用于构建生物反应器操作的大规模动力学模型,这有助于理解代谢和基因表达。MATLAB有如应用设计师和Simulink等软件包,可用于数据可视化和控制。另一方面,Python作为一种开源软件可以链接到Python Web客户端进行可视化和基于Python的过程控制软件。

3.数字/云平台走向数字孪生

软件公司开发了不同的平台,以在虚拟平台内集成数据采集和分析。在生物制药领域,SIEMENS提供了一系列产品,如COMOS、gPROMS和SIMIT,以支持数据传输、建模和可视化。COMOS允许数据硬件流从硬件设备流入COMOS平台,然后数据可以转移到gPROMS或Star-CCM+软件,用于生物制药上游和下游设备设计、过程分析和优化。最后,模型可以部署在SIMIT平台上,用于过程培训、虚拟调试和验证。ATOS与SIEMENS合作开发了一个专门为制药公司设计的集成过程数字孪生系统。该平台包括过程传感器、PAT系统、数据集中化平台、自动化和控制系统、预测和预防模型,最后是2D/3D监控和可视化平台,并支持Web应用程序。Dassault Systems提供基于3DEXPERIENCE平台的“为生物制药制造而制造”解决方案,以分析数据和优化生产。3DEXPERIENCE提供了一个基于云的环境,允许用户访问数据和虚拟工厂以进行过程监控和数据共享。该平台与MODSIM系统集成,该系统具有数据传输、几何清理和模型构建的能力。

4.生物制药中数字孪生的发展

近年来,人们致力于生物制药操作中数字孪生的发展。要为现有的物理工厂实现数字孪生,可以根据上一节提到的软件构建一个完整的虚拟工厂,并需要建立物理-虚拟工厂通信。本节从三个方面回顾了生物制药操作的进展和研究,包括过程分析技术、过程模型构建和物理-虚拟工厂集成。图6.2描述了包括这三个组件的数字孪生平台,突出了方法论,并列出每个单元操作的详细输入和输出,这些可以测量和优化。

图 6.2 生物制药制造的完全集成数字孪生框架

4.1.PAT工具

实现DT的另一个关键要素是从进行中的过程中获取实时信息,并将信息转化为对过程的知识和理解。因此,有必要在适当的位置放置合适的传感器,进行在线监测,以测量操作变量并估计产品属性。FDA在2004年引入了过程分析技术倡议,以从离线测试转变为实时在线测试和全面过程控制。PAT的实施有助于提高整体过程理解,并确保生物制品的预定质量目标。

在生物过程监测中,使用不同类型的在线传感器来测量不同类型的过程参数(物理、化学和生物参数)。有关传感器、技术和PAT安装的详细信息可以在Maruthamuthu等人的研究中找到。尽管在线或近线探针和系统已经发展得很好,但在快速检测产品相关污染的微妙结构差异和确定病毒负载的缺失方面存在挑战。光谱方法很重要,因为它们可以快速自动检测,无需样品准备/销毁,并且提高了可测量性和准确性。光谱传感器可以与其他非光谱测量相结合,以测量多个属性并提高过程可靠性。

更重要的是,多元数据分析可以与物理传感器结合,解释光谱数据并提取有关过程和产品相关属性的信息。这种结合允许在线监测,并被称为软传感器,可以基于模型或数据驱动。基于模型的软传感器主要依赖于过程的基本原理知识。这种类型的软传感器的应用受到深入过程知识和增加的计算复杂性要求的限制。数据驱动的软传感器依赖于化学计量模型,将容易测量的变量与历史过程数据相关联。化学计量技术,如偏最小二乘法(PLS)和主成分分析(PCA),通常用于描述过程变量与在先前或当前运行期间收集的测量数据之间的关系。然而,由于数据收集、存储和管理的进步,机器学习技术被应用于准确捕捉相关性。人工神经网络(ANN)、支持向量回归和高斯过程的应用在文献中已经得到证明。为了处理与嘈杂和稀释的信号采集相关的问题,卡尔曼滤波方法已经被纳入软传感器。

软传感器用于监控关键过程参数已经在生物制药行业得到实施。上游生产的光谱应用主要集中在细胞生长监测和培养组分定量。紫外-可见(UV-vis)光谱法已被用于在线测量细胞密度和氨基酸。近红外(NIR)技术被应用于测量生物量、代谢物(葡萄糖、醋酸、乳酸、谷氨酸等)、细胞密度和活力。二维荧光光谱法也用于分析如生物量和产品滴度的过程参数,并监测代谢活性。拉曼光谱法也被用于监测生物过程中葡萄糖、谷氨酰胺、氨和生物量浓度。对于下游操作,传感器应该能够监测产品和杂质浓度。值得注意的是,与上游相比,光谱传感器在下游过程中的应用较低。目前,UV-vis光谱法是下游纯化程序中最常用的技术,用于测量蛋白质浓度和定量。此外,这项技术最近已应用于超滤/透析过程中,以监测产品浓度、粒径和缓冲液交换。此外,NIR被应用于实时测量柱入口前的mAb浓度和柱出口的柱突破。这些数据被基于Python的控制软件用来实现连续Protein A色谱的实时装载控制。漫透射荧光光谱法也被用于观察Protein A树脂的污堵。在线拉曼光谱法首次应用于下游色谱法,以监测Protein A柱的突破。

4.2.过程建模

要在生物制药制造中实现数字孪生,需要对物理工厂进行完整表示,这就是过程建模非常重要的地方。过程建模将过程知识转化为数学表示,有助于减少实验工作量,深入理解过程行为。根据单元操作的类型和建模目标,通常采用不同的建模方法,如机械式、替代式和混合式建模。在开发单元操作模型之后,这些模型可以集成在一起构建流程图模型。在本节中,将根据每种建模策略,回顾生物制药领域过程建模的当前进展。

4.2.1.机械式建模

在生物制药制造中,使用一系列生产步骤生产基于蛋白质或mRNA的产品,包括生物反应器、分离、纯化步骤和最终配方步骤。对于生物反应器建模,机械式模型可以将操作条件(如溶解氧、pH值、温度、给料策略、培养基组成)与细胞活性、代谢物浓度、系统均匀性和流体动力学相关联。这些模型可以预测和优化过程生产力以及产品质量。在生物反应器内部,存在一个复杂的系统,具有多相传输现象,动态变化的细胞群体特征是复杂的生物反应。这些现象可以通过结构化或非结构化动力学模型、通量平衡分析模型和CFD仿真来捕捉。表6.1中的选择性示例显示了不同建模方法的能力。表明动力学模型主要用于通过调整温度下降和给料策略来预测和优化滴度和产品质量。给料策略包括给料频率、数量以及额外成分。除了滴度和质量,Alhuthali和Kontoravdi使用群体平衡模型预测细胞培养过程中宿主细胞蛋白(HCP)的积累。然而,动力学模型不能包含所有代谢反应,以避免计算成本高昂的计算。在化学计量模型(如通量平衡分析(FBA)和代谢网络分析)中,主要假设是认为细胞内反应处于伪稳态,净通量为零。使用这个模型可以估计细胞内代谢循环的通量,以了解不同操作条件下的代谢瓶颈。为了捕捉细胞动态,开发了动态代谢通量分析,它将时间域离散化为多个间隔,并计算每个间隔期间的通量变化。另一种方法是将化学计量模型与动力学模型集成。如前一节所述,CFD仿真可用于捕捉生物反应器的气液传输和混合不均匀性。CFD仿真可以与动力学建模方法集成,通过使用氧气添加、营养不均匀性和搅拌速率来预测不同操作条件下的滴度。

在下游操作中,柱色谱法在过去二十年中在生物制药蛋白纯化中发挥了主导作用,具有高选择性。通常,在初步捕获步骤中应用Protein A色谱法以去除与过程相关的杂质,而不同模式的色谱法(如离子交换、混合模式和疏水色谱法)用于抛光步骤,以进一步去除产品相关和其他残留杂质。目前对色谱法建模的研究集中在理解移动相中的溶质传输(粒子间和粒子内)和固定相中的动力学吸附。根据不同的假设和简化,有不同的机械式模型来描述柱内移动相的质量传输,包括平衡分散模型、集中动力学模型和一般速率模型(GRM)。其中,一般速率模型是最全面的,它考虑了柱间隙体积中的对流和轴向分散、溶质从柱间隙到粒子内孔隙空间的膜质量传递、树脂粒子内的孔隙和/或表面扩散以及蛋白质吸附。传输模型与动力学模型耦合,以描述驱动色谱分离的吸附现象。文献中有不同数学形式的动力学表达式,其中Langmuir等温线是最简单且最广泛使用的模型,用于说明粒子内结合机制。尽管如此,由于Langmuir模型假设独立结合位点且不能考虑盐对吸附的影响,因此引入了结合空间位阻效应的立体质量作用(SMA)模型,用于离子交换色谱法。在机械式模型构建之后,需要进行参数估计和模型验证,以避免过拟合并确保模型的可靠性和普遍性。这些开发的机械式模型可以进一步有助于预测纯度、产量和生产力等性能指标,识别设计空间和过程优化。此外,为了捕捉柱径向方向内流的不均匀性,CFD建模也应用于模拟动态流体流动,但由于计算成本高昂、对柱内部几何形状的知识要求高以及实验验证的困难,CFD的应用受到限制。值得注意的是,最近由CADET(色谱分析和设计工具包)开发的二维一般速率模型(GRM2D),这是在Eric von Lieres博士的监督下的一个开源软件包。新构建的GRM2D模型通过引入径向坐标来考虑沿径向维度的非均匀传输,从而适应GRM。

在生物制药下游过程中,基于膜的单元操作如病毒过滤和超滤也是不可或缺的。病毒过滤器被广泛使用以确保生物治疗蛋白的安全性,尺寸排除通常被认为是病毒清除的主要机制。结合不同阻塞指数的阻塞模型理论以及滤饼过滤模型,可以准确描述病毒过滤行为,如膜污染和不同缓冲条件下的过滤通量。除了尺寸排除机制外,还存在其他机制,如Langmuir和Freundlich理论描述的吸附。超滤模块通常用于调整目标蛋白组分的浓度和缓冲介质组成。已经开发了可靠的热力学模型来表示超滤过程,该过程通过静止膜模型组合来建模,用于浓度极化的渗透压模型和边界层模型用于通过膜的质量传递。Binabaji等人开发了一个机械式模型来描述高浓度抗体溶液下的超滤行为,并通过实验工作验证了该模型。该模型捕捉了高浓度下的分子间相互作用和反渗透现象,通过模拟评估膜模块和操作协议的效果,有助于增加滤液通量和最大可达到的浓度。

4.2.2.替代式建模

机械式模型因计算能力高而受限,其准确性高度依赖于获得的过程知识。替代式模型,也称为数据驱动或黑匣子模型,是一种有效的用有限的理解和高复杂性来模拟过程的方法。涉及大量数据时,可以在较低维度空间中获得计算成本低廉的替代式模型,以代表原始复杂过程。替代式模型已在生物制药过程的上游和下游操作中应用。

在上游,数据驱动模型已用于细胞系选择、培养基优化、过程预测、优化和放大。多元分析具有处理大量数据和信息的能力。Sokolov等人使用PCA分析找出pH值、温度变化和培养基组成与包括聚集体、片段、电荷变体和糖链在内的质量属性之间的相关性。作者还使用了与遗传算法相结合的PLS回归来预测产品滴度和其他质量属性。类似地,Green和Glassey使用PLS和多路PLS来预测滴度和质量属性。结果表明,如pH和DO等在线测量值无法对质量属性提供良好的预测。结合氨基酸数据,可以预测质量属性,这不仅局限于实验室规模,也适用于生产规模。模型的可预测性可能被用作控制图,以识别操作过程中的偏差。PLS模型的一个限制是它只能捕捉线性相关性。为了解决这个问题,建模人员可以选择机器学习方法,如ANNs、随机森林、极端梯度提升、支持向量机、高斯过程等。Alavijeh等人从数据源要求、模型效率和鲁棒性方面回顾了每种方法的优点和缺点。Bashokouh等人使用具有多层前馈结构的ANN对滴度进行预测模型,并应用优化算法以找到培养基中胎牛血清(FBS)、温度和孵化时间的最大生产力的最优数量。

数据驱动模型的不同应用也在下游单元操作如柱色谱法中得到证明。Wang等人将ANNs建模应用于蛋白质色谱法,通过将in silico实验色谱图映射到相应的模型参数,估算吸附和质量传递参数。Li等人为模拟移动床色谱法开发了两种不同类型的替代模型,并比较了原始全阶和降阶模型在计算时间和准确性方面的性能。此外,我们之前的工作中采用了基于替代的计算效率高的可行性分析框架,结合自适应采样,用于识别Protein A色谱法的设计空间。除了在色谱过程中的应用外,ANNs和回归模型还基于膜间隔件在广泛的潜在商业设计下的CFD仿真数据进行训练,得到的替代模型可以准确预测压力损失和质量传递系数。为了捕捉复杂的污染动态,Zhang等人利用从中试规模超滤膜系统收集的数据获得三种不同的数据驱动模型(线性回归、ANNs和随机森林),比较了三种建模技术的性能,并优化了反冲洗序列定时。

4.2.3.混合建模

机械式和替代式模型都可以用来模拟过程,但它们对过程理解和数据有不同的要求。机械式模型需要对过程的先验知识基础,提出适当的假设和开发精确模型是具有挑战性的,但该模型可以具有高度的概括性,具有物理或经验解释过程。替代式模型完全由数据决定,因此数据的数量和质量显著影响模型性能。由于缺乏基本原理知识,计算效率高的替代式模型的可解释性和泛化能力较差。因此,引入混合建模来结合两种模型的优势并减轻它们的缺点。机械式模型中缺失的知识可以由替代式模型表示,构建混合模型。观察到这种策略有潜力显著提高模型预测性能。

混合模型在生物反应器建模中显示出比机械式和数据驱动模型更高的准确性、外推和插值能力。Narayanan等人使用动力学模型来建立质量平衡方程。然后,作者应用BlackBox-PLS2和stepwise-PLS2从操作参数和代谢物浓度预测速率常数。这种方法集成了动力学模型和数据驱动模型。类似地,Stosch等人也使用混合模型分析温度、pH值、细胞浓度和给料速率对生产力的影响。另一种方法是将动力学模型和数据驱动模型串联连接。Kotidis和Kontoravdi开发了HyGlycoM模型来预测不同给料策略下的糖链浓度。该模型由两个动力学模型组成,用于细胞代谢和核苷糖供体(NSDs),并使用输出 - NSDs浓度作为ANN模型的输入来估算糖基化过程。而不是使用机器学习方法,基于模型的实验设计被应用于优化培养基组成和给料策略。在这种方法中,在MATLAB中构建的机械式模型与DesignExpert(AspenTech)集成,这是一个用于实验设计和基本统计分析的软件。在这种情况下,DOE可以in silico运行,这将显著减少实验室实验的资源消耗,同时加速过程开发。数据驱动模型也可以与化学计量模型集成,以了解细胞培养过程中的代谢变化,并预测氨基酸浓度或质量属性。

除了在上游生物反应器的应用外,混合建模策略也应用于色谱和超滤程序。Narayanan等人开发了不同程度过程知识整合的不同混合模型,并评估了它们在插值和外推能力、预测准确性和应用到连续色谱系统方面的性能。具体来说,选择集总动力学模型(LKM)进行质量传递,因为柱内的流体动力学描述得很好,而ANN被引入以代表吸附动力学中缺失的知识。开发的混合模型在预测准确性和鲁棒性方面优于机械式模型。为了研究Protein A树脂的使用寿命,高斯过程首次被应用于将老化参数与清洗和装载条件相关联,然后将GP整合到集总动力学模型中构建混合模型。开发的模型可以提供老化机制的见解,这可以进一步通过过程分析和优化提供如何延长树脂使用寿命和降低商品成本的指导。关于超滤,Krippl等人建立了一个混合模型来预测不同操作条件下超滤过程的通量演变和持续时间,如不同的蛋白质、膜类型、输入参数和过滤模式。这个混合模型的预测和鲁棒性优于机械式膜理论模型,可以进一步集成到数字孪生的虚拟工厂中。Thiess等人将回归模型与物理化学模型相结合,以表征和量化超滤盒模块几何形状对质量传递和压力降的影响。

4.2.4.流程图模型

除了单独对单元操作进行建模外,还可以通过集成这些单个单元程序构建流程图模型。得到的流程图模型有助于捕捉过程变化下的过程动态,并通过对系统分析和优化进一步确定设计空间和最佳操作条件。流程图模型是完整数字孪生的重要组成部分,但由于集成过程的高复杂性和对计算资源的强烈要求,开发一个能充分代表物理工厂的流程图模型是相当具有挑战性的。因此,当前流程图开发的研究要么集中在耦合下游单元操作,要么在商业仿真软件中构建集成过程模型。

在构建下游操作的集成过程模型方面进行了几次尝试。与控制系统耦合,不同色谱系统的机械式模型被集成以构建流程图模型,以实现实时决策并自动优化操作条件。为了节省计算时间,也使用数据驱动和混合模型来构建流程图模型。鉴于上游产品和抗原结合片段的制造过程,Liu等人为多尺度优化开发了一个集成的数据驱动模型,以找到纯化过程中最佳的色谱决策,如色谱柱的数量和大小、每批的循环次数以及操作流速。Zahel等人为三个色谱步骤建立了一个集成过程模型,并采用回归方法,然后将蒙特卡洛仿真整合到模型中,该模型可用于估算过程能力,在过程变化下检查产品质量,并提供基于风险的决策。Pirrung等人还开发了一个混合模型,以优化色谱决策,如色谱模式、操作顺序和条件。此外,为集成的连续下游过程开发了一个集成的停留时间分布(RTD)模型,以描述内部质量流动,加速启动阶段,并跟踪干扰的传播。

另一方面,已经在不同的过程模拟器中构建了生物制药过程的流程图模型,如SuperPro Designer和BioSolve。虽然这些建模仿真基于质量平衡计算,无法提供不同单元之间相互联系的详细分析,但简化的流程图模型有助于开发过程设计,评估各种处理场景,并从经济和环境方面进行决策,特别是在早期开发阶段。Petrides等人在SuperPro Designer中为mAb的批处理生物制药过程构建了一个集成的流程图模型,用于过程调度、瓶颈分析和经济分析。最近,注意到从批处理到连续生物制药操作的转变。评估这种转变的可行性和可行性,并在流程图模型的帮助下做出决策是重要的。已经做出了许多努力,全面比较不同操作模式(如批处理、连续和混合)和场景在经济和生态评估方面的可行性。

4.3.虚拟与物理集成

在生物制药制造中实现完整的数字孪生(DT)很少见,因为它需要高度自动化的系统、完整的数据流集成、具有自学习能力的严格建模系统以及实时自动化控制系统。前面的部分介绍了来自虚拟工厂的建模和来自物理工厂的过程分析技术(PAT)方法。本节将介绍虚拟工厂和物理工厂集成的方法。原始数据不能直接用于数据分析和过程建模。需要进行数据预处理和数据挖掘。由于过程中获得的数据类型不同,在线或离线测量产生的数据可以具有不同的频率。缺失数据会发生并导致分析问题。Ganadharan等人回顾了处理缺失数据的方法,包括传统方法、基于插补的方法、基于似然的方法和相似性方法。这篇综述涵盖了基于生物专家知识删除或忽略数据的传统方法,以及使用统计、多变量和机器学习方法填补空白的现代方法。此外,降低数据的维度并仅保留关键信息也很重要。此外,异常值检测要求,识别用于模型训练的“金牌批次”也与模型的可信度相关。Tiwari等人应用主成分分析(PCA)后跟孤立森林(IF)算法和长短期记忆自编码器(LSTM)进行色谱数据预处理,并成功预测了柱完整性。要建立数字孪生,需要建立虚拟工厂到物理工厂的通信。Gomis-Fons等人提出了一个基于模型的控制系统,用于监控和控制小规模集成单克隆抗体(mAb)生产过程。该工作使用了来自隆德大学的研究软件Orbit与UNICORN控制软件进行通信。UNICORN连接了用于控制下游过程的泵和阀门。Orbit接收来自过程模型的结果,并向UNICORN发送命令以控制色谱中的流速和装载因子。Feidl等人利用SIPAT工具进行数据收集和集中,促进了一个SCADA系统控制连续单克隆抗体(mAb)生产。该工具连接到MATLAB以构建一个集成的图形用户界面和控制器。控制器集成了调节控制层(RCL)和监督控制层(SCL),以提供手动或自动调整过程。研究人员构建了CaptureSMB模型并将其集成到控制系统中,以实现自动控制并确保最大容量利用率。文献中报道的大多数先进控制策略都是为单单元操作开发的。例如,Kim等人展示了一个两阶段最优控制框架,该框架结合了基于模型的强化学习在预测控制中优化给料策略并最大化生物反应器的生产力。这种控制策略的一个亮点是识别模型-工厂不匹配和实时扰动。对于下游,Thakur等人展示了一个基于Python的监控和控制系统,该系统与光谱PAT技术集成,以控制色谱操作期间的装载。这种PAT技术不使用传统的基于UV的测量,而是提供了更快的响应,以实现更准确的实时控制。从上述例子中可以看出,尽管当前生物制药制造中尚未实现完全自动化的集成控制,但已经建立了基本的数字-物理集成原型系统,并正在开发不同的基于模型的控制策略,以实现更快、动态和更准确的控制。

5.挑战与机遇

数字孪生能力的快速发展和在航空航天等工程应用中的成功尝试,引起了生物制药行业和相关政策制定者的极大关注。尽管数字孪生(例如,模型和PAT工具)的构建块和政策指导方针(例如,美国的推进生物技术和生物制造创新行政命令、中国的智能制造发展五年计划和欧盟的数字化欧洲工业倡议)已经到位,但仍然存在一些挑战和差距,阻碍了该技术在生物制药行业的采用。为了在生物制药行业中实现数字孪生的准确虚拟表示,拥有适当的模型来描述物理生物制药制造过程对于数字孪生的实施至关重要。在当前文献中,尽管已经开发了各种建模方法,并将模型库纳入仿真软件,但许多详细模型仅针对单一单元操作,而不是集成流程图。部分原因可能是这些模型的开发和计算成本很高,阻碍了基于系统的建模框架和集成模型的使用。然而,必须指出的是,要使完全集成的数字孪生功能正常,需要正确连接不同复杂程度的各种单元操作模型,从而实现从上游到下游的有效信息流。为了解决这一挑战,有机会开发一个端到端建模平台,包括关键单元操作和辅助设备(例如,缓冲液准备、原位清洗),建立高效的计算算法和降阶建模方法(例如,预先分析以降低系统维度,混合建模),并利用云计算和分布式计算资源。生物制药制造模型开发的另一个关键方面是,由于基于细胞及其复杂的生物功能引入的变异性,过程受到高度不确定性的影响,这些不确定性很难控制。这些不确定性需要在建模框架中进行考虑和传播,以确保数字孪生准确反映过程状态。某些不确定性传播技术已应用于粉末基制药制造过程,但在生物制药制造领域的应用很少报道。

此外,开发的模型高度依赖于使用数据进行适当的参数化。在药物开发的早期阶段,可用的数据可能是有偏的,因为它们不是为模型开发而收集的,这干扰了对开发模型的评估和验证。这种数据量和数据质量的限制通常导致开发静态模型,这些模型仅反映特定系统的状态。为了应对这一挑战,需要建立简化的数据收集和模型验证工作流程,以及模型维护工作流程。在过程数据方面,观察到数据收集、数据处理和数据存储方面的挑战。对于数据收集,传统传感器和PAT(例如,NIR、Raman)的使用已经变得无处不在。然而,由于制造周期中的数据来自不同来源,收集到的数据通常是高维和异构的,因此在数据使用前需要先进的数据处理和分析能力来处理所有数据。越来越多的设备和软件供应商正在采用标准格式和通信协议,也有服务提供商可以促进数据的集成,但总的来说,制造数据的协调和处理更多的是一个商业决策。对于数据存储,由于在生物制药制造中采用数字孪生后数据量会大幅增加,数据存储系统应具有大容量存储能力,以及快速稳定的数据访问系统分析和数据通信,以及可靠的安全特性。信息安全是生物制药行业面临的一个新兴挑战,因为收集和存储的数据需要符合监管指南的数据完整性目的,系统应受到保护,以防止数字入侵和操纵等网络安全风险。这一特定挑战已在多个国家级治理政策文件中得到注意,并导致了在研发网络物理安全系统方面的机会。随着虚拟平台的开发,与物理工厂集成也存在挑战。生物制药行业中的大多数应用都强调从单个单元操作的传感器到虚拟平台的单向数据传输,而反向传输很少见,除了少数反馈控制案例。值得注意的是,为了实现完全集成的生物制药数字孪生,也需要从虚拟到物理组件的信息流,以帮助识别异常,进行实时优化,并确保过程和工厂范围的控制。最后,作为一个高度受监管的行业,监管机构对数字孪生实施的看法是一个重要考虑因素。随着使用建模和仿真工具的努力和成功越来越多,监管机构已经展示了他们在这一领域的不断发展的能力和专业知识。最近,FDA还发布了一份关于生产和质量系统软件计算机软件保证的行业指南草案,详细说明了在计算机系统验证和批准方面的一些观点,为指导行业接受数字孪生组件迈出了关键一步。

识别微信二维码,添加抗体圈小编,符合条件者即可加入抗体圈微信群!
请注明:姓名+研究方向!



本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(cbplib@163.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。                               

抗体圈
关注生物药行业动态,对热点进行深入解析。
 最新文章