合成生物学的新纪元——微生物群落设计

科技   2024-11-18 15:47   湖北  

摘要:合成生物学将生物学复杂性概念化为具有预定功能的生物部件、设备和系统的网络,对基础和应用研究产生了革命性影响。随着前所未有的能力合成和跨生物体转移任何DNA和RNA,合成生物学的范围正在扩展并以以前难以想象的方式被重新创造。该领域已经成熟到可以构建高度复杂的网络,例如合成生物体的人工群落。同时,计算生物学成为生物学研究的一个不可分割的部分,计算模型帮助揭示生物学现象日益增长的复杂性和新出现的特性。然而,将建模完全整合到合成设计过程中仍存在巨大的未开发潜力,为科学进步提供了激动人心的机会。在这里,我们首先强调在计算机辅助设计微生物群落方面的最新进展。接下来,我们提出这样的设计可以从无生物体的模块化建模方法中受益,该方法将重点放在生物体功能模块上,以设计多物种群落。我们主张从以单一生物体为中心的方法转变为强调群落中生物体的功能贡献。通过使用模块化计算模型和部件及电路的数学描述来组装合成生物系统,我们可以定制生物体在群落中扮演特定的功能角色。这种方法与合成生物学策略一致,并为设计人工群落提供了激动人心的可能性。

1.引言

越来越明显的是,微生物联合体是大多数生态位的普遍特征,这些群落的特征在中观和宏观尺度上的各种涌现特性中扮演着重要角色。这类联合体的流行例子包括人类肠道微生物组和与植物相关的土壤微生物组,它们在生物体健康和疾病中都扮演着关键角色。随着对微生物联合体自然功能的欣赏增加,分子生物学工具在力量和精度上也有所成熟,引发了对复杂自然群落工程和从“底层”合理设计定义良好的微生物群落的兴趣。合成微生物群落的应用提议广泛,包括减轻人类疾病、提高作物产量和可持续生产有价值的生物分子。然而,微生物联合体的理论潜力与它们在更大规模的实际应用中成功实施的例子之间存在显著差距,例如发酵,引发了关于炒作与交付的合理问题。在这篇观点文章中,我们探讨了合成生物学的关键原则——特别是生物功能的模块化——可能提供一个有用的框架,以概念化复杂的微生物网络并通知新定量模型的发展。我们建议,在联合体中将单个物种抽象为“群落功能模块”可能有助于将对任何特定微生物组合的上下文特定观察所获得的见解转化为对不同平台有用的设计原则。我们讨论了基于“群落功能模块”构建粗粒度模型可能具有宝贵的预测能力,以协助未来对微生物群落工程的研究,并考虑这些模型目前可能遇到的挑战。

2.从合成部件到群落

合成生物学现在是一个成熟的研究领域,有着新开发的生物分子工具、设备和细胞结构及功能模块的记录。合成生物学的一个核心原则是,生物系统可以通过简单的“模块”(例如DNA调控元件和蛋白质域)之间的相互连接展现出高度复杂的行为,这些模块无论在它们所包含的生物体环境中如何,都能展现出稳健、定义良好的功能。合成生物学的原则已经发现相关性,并已应用于从基础到生物技术的研究设计中,为全球挑战提供了有希望的解决方案。

合成生物学“黎明”时期构建的第一个合成回路高度依赖于将遗传控制系统分解为可定义的部分,然后收集和使用在不同上下文中使用这些部分时最重要的现有定量数据。虽然早期工程部分受到克隆技术限制,但这一限制在近年来已基本消失。改进的DNA合成和组装技术为设计越来越复杂的系统奠定了基础,如生物细胞和无细胞多用途代谢工厂,以及合成原生细胞和外源生物系统。目前进入第三个十年,合成生物学已经达到了显著的成熟度,为设计越来越复杂的系统铺平了道路。日益强大的DNA合成和重组工具也使该领域能够考虑概念化和操纵更大的“功能模块”(例如代谢途径中的多个基因),甚至整个细菌和真核细胞。

重新组合大型功能模块的一个例子是设计多物种合成微生物群落:其中单个微生物菌株可能是自然来源或基因工程化以执行所需功能。然而,文献中的许多当前应用是通过遵循更手工和直观的方法实现的,而不是遵循整个工程周期并使用定量方法。在合成生物学的第二阶段取得成功将需要回归定量表征和数学建模的原则,以提高效率并缩短开发时间。生态学中的下一代基于个体的模型(IbM)就是这样一种方法的一个例子,其中基于生物体相互作用的已知机制,可以开发出预测模型来模拟群落动态。

微生物通常共存于高度复杂和动态的群落中,群落中的个别物种可以根据种群密度、环境条件和资源可用性占据不同的角色。由于成员之间的众多相互作用,微生物群落实现了非常复杂的功能。整个群落展现的特定功能(例如代谢转化)是单个生物体单独无法实现的。尽管缺乏对个别物种的正式理解或对群落如何形成和维持的基础知识,微生物群落已成功用于某些生物技术过程(例如发酵和废物处理)数个世纪。理解和利用这些群落能力是合成生物学中一个新兴领域,与微生物联合体工程领域紧密相关。微生物群落在特定应用中的长期使用为我们提供了对合成微生物群落长期潜力的增加信心——但只有在该领域能够利用设计-构建-测试-学习循环的力量,重新想象它们在更广泛的生物技术中的应用。

如何从头开始创建一个合成群落?我们提出在计算模型创建方式上的范式转变,以辅助人工群落设计。我们不是关注生物体,而是提出关注生物体在群落中履行的功能角色(见图1中的in silico设计)。这意味着模型应该被设计为描述所需功能,而不管哪个特定的微生物物种执行特定功能。我们提出,“在设计具有特定目的的群落时,它包含哪些特定生物体是不相关的:生物体只是包含必要代谢途径、提供所需功能角色的底盘。”

图1. 应用于生物学的计算机辅助工程循环。齿轮代表计算(in silico)和合成(in vivo)工作的协同和持续参与。基于规格(例如成本和环境条件)创建目标分子或合成系统。然后,将其与包含有关生物体生产能力信息的数据库进行匹配(通过计算方法测量或推导,例如基于约束的建模或网络扩展)。基于数据库中的信息选择生物体,然后仅分析它们的关键特征(例如,将生产顺丁烯二酸的Ustilago maydis简化为一个可以生产顺丁烯二酸的模块)。然后,这些合成构建块被翻译成数学术语,从中可以创建动态模型,遵循建模的经典方法(开发、校准/参数化、测试、验证、细化和预测)。一旦验证,模型的输出可以提出理论上最佳的共培养选择特征和生物体,产生目标分子的产生或在特定条件下创建稳定的合成群落。

3.合成生物学的建模

数学和计算生物学正成为跨多个尺度研究生物系统的一个重要部分。它们提供了严格的假设测试的定量方法。结合可用的大型数据集,它们将信息组织成相互连接的知识中心,并为实验探索提供指导。随着设计复杂性的增加,我们需要使用建模来指导第一周期设计阶段的第一步。为了制作预测模型,我们需要对部件及其相互作用产生的属性有深入的定量理解,以便能够将它们组合起来,设计更复杂的系统。最近,大量的努力被投入到将建模整合到指导合成生物学方法中,就像预测模型指导工程师设计新的技术设备一样,扩展了可用工具的范围。

3.1.挑战

随着现代计算能力和并行支持,技术上不再有问题组装和模拟数千个方程的系统,但我们在设计一个有用的大肠杆菌细胞内所有过程的模拟方面面临更根本的困难。虽然发动机燃烧的模拟基于几个相当简单的方程,例如描述连续性、能量和动量,但没有通用方程描述单一细胞过程。每一个酶促反应和每一个转录因子结合过程都必须通过一些需要实验验证和参数化的方程来描述,这些方程需要通过繁琐、耗时且通常是湿实验室实验来完成。不幸的是,个别实验室产生的新的高通量数据收集不会解决所有阻碍强大预测模型发展的挑战。首先,我们需要广泛的标准化,这在其他工程领域已被证明是关键。然而,尽管社区意识和卓越的、一致的努力,标准化不幸的仍然在技术上不可行或不是学术研究的优先事项,也不是资助机构。此外,在模拟生物系统时,人们必须面对两个层面的不确定性:像复杂的物理系统一样,复杂性本身将产生涌现的、本质上不可预测的特性。此外,构成生物系统的单个实体只是近似表征,它们的行为通常不能完全由潜在的理论解释。

直到对生命系统的组织原则有了更基本的理解,我们必须处理缺乏坚实理论基础的高度复杂系统的困境,这让我们在可控性和复杂性之间的权衡中只有有限的实用解决方案。一个当前的选择是降低我们模型的复杂性,这样我们就可以理解和系统地测试在构建模型时所做的所有假设。通过这种方式,我们将获得对被调查系统的理解,但代价是详细的定量可预测性。这样的简单模型极其有用,并且也已成功用于设计合成系统(见遗传开关)。或者,我们可以组装高度复杂和极其详细的模型,并用大量可用的实验数据喂养这些模型,复制数字孪生(DT)方法。在工业中,DT是从众多数字组件组装而来的物理对象的虚拟准确表示,为物理对象提供了成本效益高的替代品。这种方法以可控性和理解为代价换取可预测性。从概念上讲,它们遵循机器学习和人工智能方法,通过这些方法,高度复杂的模型由算法自动构建,这些算法很好地复制了数据。尽管它们在进行定量预测方面极其有用,并且目前正在为许多生物铸造厂开发,但由于它们的复杂性和特异性,几乎不可能推断出对其他生物系统普遍适用的共同和普遍原则。因此,一个有希望的替代方案是从机械理解与机器学习算法的结合中出现,以物理约束递归神经网络的形式。这种新一代模型最近被训练以预测微生物群落动态和目标功能,并被用来选择实验条件,以最小化的实验集最大化所需的代谢产物生产,导致最佳设置。尽管作为基于神经网络的模型,这种方法提供了有限的机会来提取有关系统的新知识。

3.2.无生物模块化方法在合成群落建模中的应用

尽管前面提到了挑战,但最近已经成功完成了稳定的、完整的合成双菌株和三菌株微生物联合体的计算设计。同样重要的是,已经存在许多工具来支持新途径的硅基设计,并且基于集合动态建模方法的结果开发了新的合成设计工具包。这突出了该领域所取得的显著进展和进一步发展的有希望的潜力。许多在研究单一生物体代谢方面证明成功的数学方法已经被改编用于研究联合体动力学。特别是,基于基因组规模模型的约束建模技术,如通量平衡分析(FBA),已成功应用于研究良好研究的生物联合体(参见经典方法和可用工具的最新综述)。已经开发了几个开源软件包来研究群落,例如微生物组建模工具箱或MICOM,它们封装了专门用于研究肠道微生物群的优化技术。此外,已经开发并成功应用于研究单培养亚群落的涌现属性的动态FBA(dFBA)网络,通过配对实验预测形成联合体的最佳伙伴,或解释三物种联合体的稳态种群分布,其中COMETS是最近和最全面的一个,具有广泛的适用性到微生物群落。然而,尽管这些方法提供了微生物相互作用的知识,但它们尚未遵循在人工群落中设计一个新的人工生物体的合理方法。无论是生产一种全新的化合物还是更有效地生产已知化合物,计算模型都应该通知分子模块的选择,例如,通过提供有关最终产品性能的定量预测。理想情况下,计算框架可以像Schwander等人的工作那样指导,其中使用理论工具和简单的热力学定律,提出了新的酶步骤以包含在碳固定途径中,指导创建一个更有效的合成CO2固定途径。

我们认为,要充分挖掘合成生物学的全部潜力(例如,开发新的抗菌化合物,设计更有效的合成途径),有必要从众所周知的模型生物转移到非模型生物的未知领域,这些生物的定量数据很少。实际上,我们看到了完全放弃以生物为中心的观点的可能性,而转而关注生物体为群落提供的功能。如最近的一个例子,进化博弈论可以用来预测不同环境景观中两种生物群落的动态,通过考虑它们的权衡和成本,这取决于它们选择的策略。最近提出了几种允许这种转变的计算方法。一方面,有了新工具如μbialSim,对实验元组OMICS数据的解释,重点关注代谢物交换作为主要的互动类型,允许模拟数百种肠道微生物群。这种方法虽然有希望,但受到大量数据集可用性的限制。因此,另一个可能的方向是遵循模块化方法,将复杂的代谢网络简化为更易于管理的模块,基于它们的功能角色。对于构建群落非常重要的典型功能可能包括生产某些代谢物、提供营养物质以及为其他群落成员展示保护功能,例如通过生产抗菌化合物。然后,这些模块可以存储在数据库中,就像BioBricks或标准生物部件登记处一样,提供一系列电路供选择。这样一个连贯的数据库,用标准化格式描述的模块,可以促进人工群落的自动创建。最近,出现了几个计算机辅助群落设计的示例,包括软件开发。McComedy(微生物群落、代谢和动态)是一个平台,允许基于它们的消费者-资源关系创建微生物系统的IbM。简单的构建块(“过程模块”)可以根据特定的研究问题进行组合和参数化。另一方面,Karkaria等人使用了关于细菌“生产能力”的假设,即抗菌肽(细菌素)来识别最合适的候选者(模型),这些组合导致一个稳定的双菌株或三菌株群落。最后,Sakkos等人最近使用IbMs预测了联合体生长的调节,这取决于蔗糖生产力。

在图1中,我们提供了这样一个无生物模块化过程的计算建模的图解,支持合成设计。构建具有所需行为的群落的起点是描述共同生物动机的模块数据库或库。这些模块的复杂性可以从简单的分子循环,导致蛋白质修饰,如磷酸化/去磷酸化,这是细胞中信号转导的主要机制,到更复杂的子系统,如整个代谢途径。这些模块应该由动态数学模型描述,可以定量模拟它们功能角色的变化。行为反过来由合成生物学家所需的要求指定。这些具体规范可能考虑给定代谢物的丰度,群落的动态行为(例如振荡),群落成员之间的竞争互动等。因此,我们使用两个相互锁定的齿轮作为视觉表示,即硅基的工作能力可以输入到后续周期。提出的模块化设计允许以灵活的方式组合模块,并研究由不同模块组合组成的大量复杂网络的涌现属性。特别是,这样的模型将提供一个框架,系统地研究隔离部分的行为在组装成更大的电路时是否得以保留,因此将有助于进一步研究代谢分工等现象,其中代谢任务被划分为不同相互作用菌株的互补步骤。通过这种方式,可以通过组装最符合规格要求的不同模块,以预测性的方式设计人工群落网络。

可以说,转向独立于物种的模型可能是对固有复杂生物特征的过度简化。显然,将生物体抽象为功能模块,根据定义,会从联合体模型中移除一些细节,但先前的艺术和新出现的数据集支持这种方法可以有价值。通过类比,生态模型在中到宏观尺度上已经展示了数十年的相当预测能力,而无需考虑生物体可能微妙差异的无数种方式(例如,不同种类的草或传粉者)。同样,越来越多的例子表明,复杂微生物群落的特定物种组成可能随时间/地理变化,而特定群落功能在更广泛的尺度上是稳定的。作为一个说明性的例子,最近对与光合硅藻Phaeodactylum tricornutum相关的异养细菌的宏基因组调查,确定了三个功能上的“行会”微生物活动(即大分子再矿化者、大分子使用者和小分子使用者),这些活动在不同群落中是恒定的,但缺乏系统发育关系。

4.合成生物学的新时代——群落设计

微生物群落由于劳动分工、空间组织和对扰动的鲁棒性,比单培养有许多优势。群落具有独特的催化活性,可以通过途径的分隔和分子负担的分配使用复杂底物。我们现在拥有合成生物学工具和方法,允许我们通过工程化它们的通信、基因表达和代谢相互作用来构建和控制群落。控制群落内单个物种的行为对种群动态有影响。计算模型可以预测代谢交叉喂养并推断随时间变化的种群动态,帮助我们解决复杂性并系统地工程化群落。将基于模型的假设与组学研究相结合,有助于设计和实施合成光养微生物群落。

要充分释放合成生物学在从头设计复杂生物系统(如合成微生物群落)方面的创造潜力,需要进一步发展三个主要研究方向。(i)在生物学方面,我们需要一系列方法和技术来获取将被使用的部件以及已经组装好的设备(数据库)的定量数据。(ii)在建模方面,我们需要提高已有的、首次定制的、主要用于简单网络的常微分方程模型的预测能力,最终能够使用它们来指导更复杂的分子和细胞代谢、信号和群落行为网络的组装。(iii)最后,实验者和理论家之间的紧密合作应该成为标准。我们认为,这应该从教育新一代生物学家更多的定量方法和对生物系统的定量方法开始;最终,我们可以放弃“传统”和“计算”生物学家之间的区别。

然而,微生物-微生物相互作用的详细机制洞察通常仍然未确定。尽管在线监测系统和多样的生物传感器可用于微生物培养,但大多数微生物群落的定量和动态数据非常有限。理解代谢交换的基本原理对于控制细胞间相互作用、时空协调、鲁棒性和合成微生物群落的稳定性至关重要。设计合成联合体内部稳定相互作用的一个关键挑战是理解如何在生产性隔间中跨微生物群落分配功能角色以实现理想的种群级行为。如何定义这样的分配或通用功能?在这里,我们看到了无生物模块化建模方法的潜力,以指导复杂群落设计,并指导构建合成群落,以利用新的行为和在生物技术、医学和农业中的应用。关键在于关注代谢相互作用和功能,而不是生物体本身。计算机辅助模拟将有助于缩小可能的目标,并回答这个问题:“在群落内编码特定行为需要哪些组成部分?”这与收集深思熟虑的“高水平”定量数据相结合,将完全释放计算机辅助群落设计的潜力。

识别微信二维码,添加生物制品圈小编,符合条件者即可加入

生物制品微信群!

请注明:姓名+研究方向!






本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(cbplib@163.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。

生物制品圈
资源分享,行业交流!
 最新文章