工程生物学与自动化——以可重复性为设计准则丨再创

学术   2024-09-09 16:49   福建  

张馥淳 / 作者

孟凡康、范锐 / 审校


工程生物学因对工业原理的依赖而出名,更重视“转化”与“商业化”,被认为是全球向生物经济过渡的关键。在发展中,这个学科面临了一个共同的需求:操作大规模生物样品。在这样的背景下,生命科学领域自动化应运而生。自动化的一个重要特点是高通量,是对大规模生物样品进行操作的关键。近些年来,生物铸造厂概念逐渐推广,我们可以通俗地将其理解为一个为了让生物更容易工程化而专门建造的物理场所,它更是实验室自动化的驱动力。(再创推荐阅读:什么是生物铸造厂?丨再创

当我们提起自动化相关的特征时,我们往往会首先谈论高通量。但其实,我们更需关注另一个特征——可重复性。可重复性更是工程的核心原则,如果不强调可重复性,任何工程都无法取得最终的成功。

Replicability(下文通称:可重复性),指在考虑到系统不确定性水平的前提下,回答同一科学问题的研究中能得到一致的结果。在相同和不同方法下,实验结果具有可复制性是结果被认可的重要条件。


近期,来自伦敦帝国学院的 Richard Kitney 课题组发表了一篇题为「 Engineering biology and automation–Replicability as a design principle 」的综述,指出可重复性是大规模处理生物样品自动化流程设计的核心,需要有效的误差控制,并介绍了支持可重复性的 IT 基础设施的设计原则。

原文链接:https://ietresearch.onlinelibrary.wiley.com/doi/10.1049/enb2.12035

学术界研究结果的不可重复性问题引发了学术杂志与大众媒体的担忧。《科学》杂志上一篇具有里程碑意义的社论直言不讳地指出:有报道称,相当一部分同行评议的临床前研究是不可重复的。《自然》杂志也调查发现很多实验室的研究成果无法被复制。

造成这种“可重复性危机”的可能有如下因素:

  1. 生物学的内在随机性,生物学过程本身存在随机性和不可逆性;

  2. 自动化过程的弊端,尽管自动化可以通过减少人为因素和提高实验通量来改善可重复性,但如果自动化系统设计不当,它可能引入新的不可控错误和混杂变量。这些新问题可能导致结果污染,甚至使数据无效。

  3. 缺乏有效的 IT 支持,如果能有一个能够支持自动化流程、减少人为错误并确保协议严格遵循的 IT 基础设施,也能一定程度改善“可重复性危机”······

在这样的“可重复性危机”背景之下,研究人员也在积极进行改进。液体处理是工程生物学中最常见的步骤。手工进行液体处理操作效率低下,因此液体处理平台是研究实验室转型及其自动化采用的核心。液体处理平台优势明显,如通量高、工作一致、不疲劳,但是该平台也非没有挑战,影响液体分配的因素可能有移取液体的密度和粘度、蒸发控制、堵塞检测等等···以上因素是液体分配过程中误差来源的最基本解释因素,但是这些因素较为细致,在实验方案的设计中,我们难以根据这些因素改进实验方案,比如说我们很少在减少误差的措施中选择改变液体的密度和粘度。

在这篇文章中,作者介绍了如何在自动化层面进行设计以提高可重复性,包括错误控制、标准化以及 IT 基础设施的支持。

成功的自动化离不开有效的错误控制。因此,Albert 开发了一个错误分类框架,结合物理和机械因素以及可观察到的影响,分析了三种错误来源:设备相关错误,如枪头对体积精确度产生影响;移液方式,正向移液和反向移液,适用的液体不同,误差也不同;液体分配方案,顺序分配方案和迭代分配方案有不同的污染来源。

本文作者借鉴了 Albert 的错误分类框架,并在伦敦生物铸造厂通过构建番茄红素在二甲亚砜 (DMSO) 中的标准曲线进行了研究。在实验方案设计的过程中作者发现了几个错误来源,有混合液的新鲜程度、稀释方法、测量误差等;这几个错误来源必须通过设计分离并严格控制。即使是这样一个简单的应用,由于相关的人类认知负荷,板块设计很快就超出了人工实现的范围。即使在适度的规模下,研究表明,在开发和部署自动化管道时,也应该从一开始就考虑到可重复性和错误控制。

专用的 IT 基础设施来支持自动化是提高可重复性的一个重点。目前,我们有专用的 IT 基础设施用于支持自动化,主要都是将独立的自动化任务集成到自动化管道中,在该 IT 基础设施的设计中,可重复性应是核心元素。

在该 IT 基础设施中,每个自动化任务都有两个组件——一个软件层,耦合到一个机械化层,任务指令由软件层传达给机械化层,使自动化平台执行指定的任务,这对应单个任务的自动化,我们可以将其称为“一级集成”(图片顶部)。图片中部展示了一个通用工作流,在一个微孔板上依次执行四个任务,并集成到单个自动化工作流中。信息流用黑色箭头表示。实物(微孔板)的流动用白色箭头表示。如前所述,工作流中任何任务的指令都被传送到任务的软件层,然后再传送到它的机械化层。现在有一个伴随的 IT 基础设施来监督所有数据(操作数据和实验数据)的收集和存储,我们将其称为“二级集成”。

图片底部展示了支持可重复性所需的IT基础设施类型,我们称之为“三级集成”。与二级集成不同,此处添加了编排器。除了收集并存储所有生成的数据外,编排器还按照工作流的顺序发送指令;监督工作流程的进展;并验证组件之间传递的信息。(编排器:Orchestrator ,一种可以执行工作流、为资源分配任务、安排、运行和监视任务的软件,但目前在生物铸造厂中未被报道应用,因为编排器是为数据处理应用程序开发的,缺乏直接连接硬件的能力,在伦敦生物研究中心有一项使用编排器的项目正在进行,我们有理由期待工作流编排器在未来几年成为生物铸造厂的支柱)

该IT基础设施建立在三组技术之上,分别是涉及数据管理和信息交换的技术、涉及发送到自动化平台和实验方案描述的指令的标准化的技术、与编排有关的技术,这三项技术都有两种共同特征:有效的连接和标准化,而这整个设计过程的核心是可重复性。

自动化的采用是工程生物学应用中共同的实际需求的直接结果,在高通量的同时,可重复性应作为大规模处理生物样品的自动化管道设计的核心原则。特别是,可重复性不应该被视为自动化工作的额外负担,而是作为成功实现自动化利益的基本要求。

高通量和可重复性之间存在共生关系,应从自动化项目启动之初就一同考虑。未来自动化实验室和生物铸造厂的发展将依赖于更灵活的平台、更好的错误控制以及 IT 基础设施的进步,推动工程生物学中更高效和可靠的实验结果的产生。


作者简介 

 WRITER 


张馥淳

再创内容创作,生物学硕士在读。希望能用生物技术切实造福人类!🌟🌟🌟



再创丨Regenesis
机器,正在生物化;而生物,正在工程化。
 最新文章