引言 /Introduction
来自丹麦技术大学的 Enrico Orsi 和马克斯·普朗克分子植物生理学研究所的 Steffen N.Lindner 等人于 2024 年 4 月 24 日在 Nature Communications 上发表了名为 ⌈Automated in vivo enzyme engineering accelerates biocatalyst optimization⌋ 的文章,在该文章中,作者提出了一种综合解决方案,通过该方案可以实现机器学习引导的自动化工作流程(包括库生成、超突变系统实施、适应性实验室进化和体内生长耦合选择),以加速开发更优质的生物催化剂。
Enrico Orsi、Steffen N.Lindner 等人 / 作者
丁小然 / 整理
当前的生物工程研究旨在设计能够提供超越自然界已开发和优化的酶活性的生物系统。这些创新不仅可以推动生物基经济的发展,而且能够设计出全新的,高活性的酶。这些酶将作为组装完整合成途径的关键部分,或直接用于合成过程中的酶驱动的催化应用(例如,在体外将 CO2/H2或甲醇转化为淀粉)。然而,创造和优化这些全新的酶反应是一项具有挑战性的任务,仅仅依赖合理的蛋白质设计,并辅以体外酶活性测量或自适应实验室进化(ALE),可能并不足以应对这个挑战。
体内定向进化方法近年来在蛋白质工程中表现出了极大的潜力。这些方法结合了生长耦合选择(即将感兴趣的酶活性与微生物适应性相结合),并已被应用于不同的优化策略。
与此同时,自动化生物铸造厂正在成为支持生物工程高通量研究的关键。这些基础设施在蛋白质工程中的应用正不断发展。此外,人工智能 (AI,artificial intelligence) 和机器学习 (ML,machine learning) 的应用正在促进并为从蛋白质到生物体层面的新生物系统设计带来重大突破。
因此作者提出,我们正在见证工程生物系统能力(Ability)和容量(Capacity)的范式转变。这些技术的结合可能会建立自动化实验室和工作流程,从而加速科学发现和创新,同时减少人为错误。
为了实现本文提出的工作流程,需要整合不同领域的专业知识(见图 1)。简而言之,机器学习(ML)被用作输入,主要有两个用途:
1. 预测对目标酶进行工程化所需的修改:通过机器学习,预测酶的设计修改,从而优化其性能。
2. 支持营养缺陷型选择菌株的设计:机器学习可以建议删除目标基因,从而设计适用于选择的营养缺陷型菌株。
接下来,通过基因删除技术创建这些选择菌株,并利用体内超突变体增加目标基因的突变率。依据生长耦合选择的原理,使用高通量和连续培养平台来富集含有进化后的目标酶的克隆微生物种群。最后,通过富集克隆的测序结果,我们可以评估进化活动的成功与否。这一过程也可以从机器学习指导的计算工具中获益。如有必要,可以对该流程进行多轮迭代,以进一步优化生物催化剂的性能。
掌握酶工程对于优化现有生物工艺或开发新的生物工艺至关重要。这是一个庞大且快速发展的研究领域,作者在这里着重介绍了一些关键的方法和概念。
酶工程的目标多种多样,包括:
1. 拓宽底物范围:通过开放和重塑酶的活性位点,以便酶能够处理更广泛的底物。
2. 提高底物特异性或对映选择性:调整活性位点,使其仅适应目标底物或中间体,从而提升酶的选择性。
3. 开发新的催化功能:应用催化原理和过渡态稳定原理来修饰支架酶,以创造新的催化功能。
4. 提高热稳定性:为了酶能够在高温下进行工业催化过程,需通过引入额外的氢键和盐桥、刚性化柔性残基、创建更紧凑的核心区域或减少表面疏水性来增强酶的热稳定性。
计算工具和预测在酶工程中至关重要,它们能帮助识别需要突变的氨基酸残基和目标区域。如果蛋白质结构已知,这些工具可以基于实验结构进行预测。如果没有实验数据,可以利用数据驱动的结构预测工具(如自 2021 年以来提供高质量模型的 AlphaFold)来辅助预测。
这包括提高酶活性、底物特异性或对映选择性、引入新反应性或提高蛋白质稳定性等目标。为实现这些目标,常用的方法包括关键氨基酸的理性诱变、半理性诱变(即定点诱变与随机诱变或定向进化的组合)以及 DNA 库的定向进化。此外,从头设计酶可以用于生成不受现有酶限制的生物催化剂。
体外和体内酶优化在关键绩效指标(KPI)方面表现出不同的特点。体外优化提供了对反应条件的精确控制,能够通过高通量筛选快速评估酶的活性和稳定性。技术改进如随机诱变(RM)和定向进化(DE)在这方面发挥了重要作用,帮助快速寻找和优化高效酶变体。超突变体和自适应实验室进化(ALE)也增强了酶的功能和稳定性。这些技术改进显著提升了酶的性能,使得体外方法在提高活性和稳定性方面表现出色。
该图显示并评分了两种方法在几个关键绩效指标方面的特性。此外,还包括对方法的其他技术改进的使用,例如随机突变、定向进化、超突变体和自适应实验室进化 (ALE)。图中还描绘了这些改进对关键绩效指标的影响。
此外,机器学习(ML)技术在酶优化中发挥了重要作用,特别是在预测和识别蛋白质结构、提高酶的稳定性、溶解度和功能方面。ML技术能够加速新酶的设计和优化,通过预测底物特异性和从头蛋白质设计,提高了酶的性能预测能力,并推动了酶优化过程的创新。
从头设计酶的目标是从零开始开发具有特定功能的新酶,而不依赖天然酶作为起点。为此,科研工作者们已开发了多种蛋白质设计算法,如 Rosetta,它依靠使用能量场的蛋白质建模来指导设计过程,探索酶工程的序列空间。在酶设计领域,15年前,首批高知名度的设计酶(如催化逆醛缩反应的酶)就已被报道。
目前,在这个快速发展的领域中已经出现了一些亮眼的成果,包括:(1)从头设计出的一种具有逆醛缩酶功能的 eight stranded β-barrel protein,其活性和立体选择性通过定向进化得到了进一步提高;(2)从头创建的人工荧光素酶,其催化效率与天然荧光素酶相当,但具有更高的底物特异性和非常高的热稳定性。
重新设计结合复杂辅助因子(如血红素铁)的酶也已成为可能:最近,一种具有可调底物结合袋的血红素酶的创造,并进一步被设计成一种高效的碳转移酶。将蛋白质设计与迭代突变结合用于高效酶工程的潜力不容小觑。例如,通过十四轮诱变将中等活性的设计酶转化为高效的生物催化剂,并结合高通量分光光度测定,实现了时间上的高效读数。
当前该领域的亮点包括从头设计的逆转录醛缩酶和人工荧光素酶,这些酶具有与天然酶相当的效率,同时展现出更高的底物特异性和热稳定性。此外,复杂辅因子(如血红素铁)的结合也已成为可能,如创建了具有可调底物结合口袋的血红素酶,并将其改造成高效的卡宾转移酶。蛋白质设计与迭代诱变的结合极大地提高了酶工程的效率,例如,通过十四轮诱变将中等活性的设计酶转化为高效的生物催化剂,并结合高通量分光光度测定,实现了时间上的高效读数。
在不久的将来,从头蛋白质设计有望成为一种成熟且广泛应用于各种酶的技术。近期,深度学习神经网络 RoseTTAFold 在蛋白质结构去噪任务中进行了优化,催生了 RFdiffusion(一种蛋白质骨架生成模型)。RFdiffusion 在蛋白质单体设计、酶活性位点支架设计(见图 2)以及金属结合蛋白质设计等方面表现出色,只需简单的分子规格作为输入。
计算酶设计在开发新型代谢途径方面尤其重要,特别是在缺少某个反应步骤的天然酶时。从头设计的方法可以提供催化所需转化的酶候选物,虽然这些酶在初始阶段的活性通常较低。随后,通过诱变和定向进化,我们可以进一步改进这些酶,从而实现高效的从新设计到自然生物转化途径的转变。
由机器学习(ML)支持的通路设计拓宽了工程设计前景
设计和实施非天然代谢途径是一项复杂且极其耗时的任务。机器学习(ML)可以通过自动化途径设计的多个阶段来缓解这一挑战。具体而言,机器学习算法能够有效预测和分析代谢反应,辅助逆向生物合成方法(即识别生产特定化合物的潜在途径)。机器学习是一种强大的工具,能够高效检测大型数据集中的模式。它被广泛用于分析通过高通量技术获得的数据集,以构建基于数据的模型。机器学习还可以通过智能探索和设计不同的酶组合和基因修饰组合,帮助优化代谢工程过程,从而提高途径的效率和产量。
例如,METIS 是一个灵活的主动机器学习工作流程,能够以最少的实验量来高效优化生物目标。其有效性已在无细胞转录翻译、基因回路和二氧化碳固定循环等应用中得到验证,这些系统的性能提高了一到两个数量级。此外,METIS 还揭示了系统性能中各因素的相对重要性,揭示了以前未知的相互作用和瓶颈。类似工作流程预计将广泛应用于遗传和代谢网络的优化和原型设计。
由于上述创新方法的应用,酶功能的表征、结构预测和从头设计以及代谢途径的起草和原型设计在生物工程中显著扩展了设计空间。然而,这也可能限制了体外测试和筛选能力,从而影响工程生物系统的优化过程。
选择菌株可进行高通量体内酶筛选
如上所述,除了体外测试,酶或代谢途径筛选还可以使用营养缺陷型传感器菌株(下文简称选择菌株)进行体内评估,通过建模设计系统的生长耦合或使用抗代谢物选择菌株。此类方法依赖于抑制生长的代谢物类似物产生的选择压力,可以通过增加酶的产量或合成目标分子来恢复生长。然而,如果要优化的酶无法通过合适的方式与宿主细胞的代谢系统有效结合以实现生长耦合,或不产生抗代谢物,体内选择可能无法发挥作用。
在本文中,作者专注于将营养缺陷型选择菌株作为体内酶筛选和进化的平台。这些选择菌株通过基因缺失中断宿主的代谢网络,使关键生物质前体或基本代谢功能的生物合成受阻。当提供“缺失”的生物质构建块或引入代谢模块(感兴趣的酶促反应)以重建基本代谢物的生物合成时,这些菌株的生长可以恢复。因此,生长情况直接反映了该模块的活性。可以为相同的营养缺陷生成多个选择菌株,以覆盖不同的灵敏度范围,从而产生不同强度的选择压力,方便筛选。选择菌株是探索酶进化的便捷平台,其吞吐量仅受转化效率的限制。
根据营养缺陷型的设计方式,选择菌株可分为两大类(图 3a):第一类是“分离(isolation)”或“解剖(dissection)”菌株,第二类是缺乏通用代谢任务的菌株。第一类包括不能产生必需生物质前体分子或合成这些前体分子的中间代谢物的菌株(隔离菌株)。这些菌株在逐步实施还原甘氨酸途径等模块时至关重要。同样,“解剖”菌株无法合成关键的生物质成分或其前体之一。在这种情况下,代谢网络的分割涉及整个代谢区域(包括多个生物质前体分子),这要求更高的酶活性来支持生长。研究中的一些例子包括使用解剖菌株生成半自养和自养大肠杆菌,或通过还原性甘氨酸途径实现完全营养生长,以及使用3-磷酸甘油酸传感器对不同浓度的反应。
▲ 图4:采用专用选择菌株支持高效的酶筛选。
b. 反应速率对选择菌株生长曲线的影响。选择菌株产生两种不同的酶变体,这些变体通过其酶活性补充关键生物质前体的合成。这两种酶变体显示出不同的反应速率(µmol min^(-1)),这些速率将影响体内选择,因为两种选择菌株可以通过其不同的生长速率(h^(-1))来区分。
一旦选择菌株配备了目标模块,生长恢复可以作为该模块酶活性的替代指标。具体来说,生长速率 (µ, h^(-1)) 可作为体内目标酶反应速率 (µmol·min^(-1)) 的粗略指标,即在专用选择菌株的背景下 (图 4b)。例如,表达两种编码相同酶活性的不同基因变体(如未进化和进化变体)的选择菌株可能由于目标酶的反应速率不同而导致不同的生长速率 (图 4b)。此外,感兴趣基因的表达水平变化(也可能是进化的结果)可能导致生长速率的提高。总之,使用生长耦合选择策略是一种便宜且高效的方法,用于确定体内酶活性。
将生长耦合与定向进化相结合以获得新的表型
在探索新兴的酶促反应(如甲酰磷酸还原酶或乙醇酰辅酶A羧化酶)时,扩大可筛选突变的解空间非常有用。在这种情况下,定向进化是一种有效工具,因为它能够增加目标序列的遗传多样性,前提是每个实验都可以实现高通量。多年来,科学家们已经开发了多种定向进化策略,这些策略根据基因序列多样化发生的位置,主要分为两类:体外诱变和体内诱变。
体外诱变方法在试管中生成基因变体文库,然后将其转化到适当的菌株中进行筛选,并获得所需结果。因此,转化效率成为可回收和筛选的基因变体数量的瓶颈。为了克服这一限制,高通量电穿孔的微流体解决方案正变得越来越普遍。常见的体外技术包括(但不限于)易错 PCR、位点饱和诱变和基于重组的 DNA 改组。此外,体外定向进化还可以与选择菌株结合,用于体内筛选进化的酶活性,例如具有改进特异性的 NADP+甲酸脱氢酶。
有关体外技术的更深入比较,可以参考该领域的一些优秀综述。再创进行了整理:
[1]Wang, Y. et al. Directed evolution: methodologies and applications. Chem. Rev. 121, 12384–12444 (2021).
[2]Yu, T., Boob, A. G., Singh, N., Su, Y. & Zhao, H. In vitro continuous protein evolution empowered by machine learning and automation. Cell Syst. 14, 633–644 (2023). Review on advancements in machine learning and lab automation for rapid protein engineering through directed evolution.
[3]Packer, M. S. & Liu, D. R. Methods for the directed evolution of proteins. Nat. Rev. Genet. 16, 379–394 (2015).
使用体内突变策略可以绕过转化效率的瓶颈,并在细胞内进行基因多样化。多重自动基因组工程(MAGE)和 CRISPR-Cas 技术(或锌指核酸酶介导的工具)是基于等位基因替换的体内诱变例子。MAGE 通过转化具有简并序列的单链 DNA 寡核苷酸池到细胞内,在体内引入多种基因修饰。重复这一过程可增加文库的复杂性,生成突变体池,随后可以在选择性琼脂平板上进行筛选。这些方法已扩展到多种非模型实验室菌株。基因组编辑的文库菌株允许根据前一次迭代的结果快速调整策略,相比于质粒基因组,具有更高的灵活性。
体内酶库生成的另一个显著优势是能够将文库生成与显著提高目标基因突变率的技术结合起来。当使用选择菌株进行酶开发时,诱变与所需表型特征的选择同步进行。这些超突变技术能显著提高突变率(从自然水平的 (10^(-10) 到 \(10^(-9)),甚至高达10^(-4)),远超通过自适应实验室进化(ALE)实现的典型突变率。这种方法可以迅速生成多样化的酶变体,并显著减少可能规避选择的脱靶突变(例如通过激活沉默基因或引入对混杂活性有影响的突变)。因此,这些技术能更全面地探索适应度景观,有助于开发出超越局部适应度最大值的酶变体。
目前已经开发了几种超突变技术,这些技术大多基于以下方法:易错DNA聚合酶(OrthoRep)、nCas9介导的 DNA 切口结合易错 DNA 聚合酶(EvolvR)或碱基脱氨酶/T7 RNA 聚合酶(MutaT7)。
OrthoRep: 通过使用易错 DNA 聚合酶(OrthoRep)进行连续的遗传变异。
nCas9 介导的 DNA 切口结合易错 DNA 聚合酶(EvolvR): 结合了 Cas9 的 DNA 切割能力与易错 DNA 聚合酶。
核碱基脱氨酶/T7 RNA 聚合酶(MutaT7): 通过脱氨酶引入突变,同时利用 T7 RNA 聚合酶进行高效的体内突变。
这些技术自诞生以来不断得到了改进。当前的开发重点是提高突变率和突变模式。例如:
MutaT7 的衍生技术包括将其扩展到酿酒酵母中,提升突变率;以及融合新的脱氨酶,并引入 dCas9 以便更好地控制 T7 RNA 聚合酶。
OrthoRep 的进一步利用包括用于进化出定制的抗体并展示在酵母表面,或改良色氨酸合酶以便从吲哚和 L-丝氨酸合成 L-色氨酸。此外,OrthoRep 系统的更新声称其每个碱基的体内置换率提高到10^(-4)。
此外还出现了一项依赖于正交 DNA 聚合酶的新技术。在该系统中,用户定义的 DNA 被引入大肠杆菌细胞,并通过一种独立于复制基因组的独特复制机制,来进行选择性复制和突变。这种方法使目标复制子的突变率提高了 2 到 4 个数量级。这些超突变技术的进步显著增强了体内基因多样性,为酶工程和其他生物工程应用提供了更为强大的工具。
除了基于酶的超突变工具外,噬菌体辅助持续进化(PACE)作为一种强大的技术引起了广泛关注。在 PACE 中,工程化的噬菌体引入基因序列变异,利用噬菌体极短的生命周期,加速了进化周期并提高了宿主细菌中目标基因的突变率。
总的来说,先进的定向进化技术(如超突变工具和 PACE)极大地简化了体内酶促反应的优化流程。通过使用这些有针对性的技术,能够扩展解决方案空间,引入所需的遗传多样性,从而最大限度地提高文库的多样性。最终,这些技术与 ALE 的结合促进了更高效的变体富集,推动了工程酶和代谢路径的优化。
一旦定向诱变轮次成功引入目标活性,就可以利用自适应实验室进化(ALE)进一步提高目标反应速率。此外,在酶进化的背景下,ALE 与选择菌株的结合使用已经被深入探讨,这种结合可以实现高效的酶优化和改良。
为了获得优化后的表型,通常需要进行100至500代的进化。这些代次主要可以通过以下三种实验方法来实现:
1. 连续批量培养(serial batch dilutions or continuous cultivation):在这种方法中,微生物种群通过不断稀释的方式进行培养,同时保持一定的选择压力。生长条件在整个培养过程中是动态的,因为选择用于稀释的时间点会影响所选择的表型。这种方法的关键在于如何设定稀释的时机和频率,以便在动态的环境下选择出具有改良特征的变体。
2. 恒化器(Chemostat):在恒化器中,培养条件在整个培养过程中保持不变。培养基的流入和流出是平衡的,稀释率决定了微生物种群的特定生长率。在这种装置中,细胞会受到稳定的指数生长,而选择压力由限制性必需营养素决定。消耗这些限制性营养素较慢的亚群将从培养中被洗出。恒化器允许精确控制限制性营养物质的浓度和稀释率,因此非常适合于长期和稳定的进化过程。
3. 浊度恒化器(Turbidostat):与恒化器不同,浊度恒化器的稀释率是根据培养物的浊度来控制的,目标是保持培养物的浊度恒定。这种方法选择能够以最大生长速率(µ(max))生长的细胞群体,因此不需要引入限制性营养物质。浊度恒化器适用于选择能够在稳定的环境条件下高效生长的变体。
根据目标表型的不同需求,可以选择以上任意一种培养方法来支持ALE实验。这些方法提供了不同的选择压力和生长条件,有助于实现对目标表型的优化。
上述自适应实验室进化(ALE)方法的共同特点是施加恒定的选择压力,这对于优化酶活性和表型特征非常有效。然而,最近一种新兴的替代方法是利用振荡选择压力来探索不同的适应度景观,并增加达到目标表型的全局最大值的机会。振荡选择压力通过在培养过程中周期性地改变选择条件来探讨在恒定压力下可能被忽略的突变。例如,施加NADPH营养缺陷型的振荡压力可以促使大肠杆菌改变辅因子特异性,从而探索不同的适应度景观。
振荡选择压力的优点小结:
1. 多样化适应度景观探索:振荡压力可以帮助探索在恒定压力下可能会被忽视的突变。这种方法允许在实验过程中周期性地改变选择条件,增加探索全局最大值的机会。
2. 避免有害突变的固定:在恒定选择压力下,有害突变可能会固定并干扰优化过程。通过周期性改变选择压力,可以防止这些有害突变的固定,从而更全面地探索适应度景观。
3. 增强酶活性的进化:通过振荡选择压力,可以使酶在不同的条件下进行优化,从而提高其在多种环境下的活性。这种方法有可能发现新的酶促反应或显著改进现有的酶活性。
结合定向进化振荡选择压力与定向进化相结合,可以进一步提高酶活性的优化效果。这种结合方法使得定向进化可以在一个更加动态和变化的适应度景观中进行,从而挖掘出更多潜在的酶变体和新型酶促反应。具体来说:
改进的适应度景观:振荡选择压力可以改变适应度景观的崎岖程度,使得定向进化更容易找到全局最大值。
综合优势:定向进化可以引入遗传变异,而振荡选择压力则可以在动态环境中评估这些变异的效果。二者的结合能够实现更加全面和深入的酶优化。
作者认为 ALE 应当被视为一种支持定向进化的补充方法,其通过结合振荡选择压力和定向进化,可以有效地在生物催化剂中开发新型酶促反应,从而推动酶工程领域的发展。
寻找用于体内酶工程的最佳微生物宿主
虽然大肠杆菌和酿酒酵母长期以来一直作为生长耦合酶和合成途径选择的模型微生物平台,但非典型宿主作为替代者正日益受到关注。
在细菌种类中,大肠杆菌仍然是首选。在 2013 年发表于 Science 的 ⌈Long-term dynamics of adaptation in asexual populations⌋ 中,大肠杆菌在长期选择压力下优化碳利用途径的能力已通过经典的长期进化实验(LTEE)得到验证,细胞通过超过 50000 代的进化优化了碳利用途径,实现了生长最大化,证明了其在代谢途径和酶活性优化中的有效性。
基于这一概念,大肠杆菌在过去五年中广泛被应用于选择和进化多种酶的活性(例如蛋白酶、脱氨酶和甲酸脱氢酶),以及表现出涌现特性的酶(无论是天然的还是工程化的,例如使用非典型氧化还原辅因子)。这些应用体现了大肠杆菌在酶工程中的灵活性,尤其在优化具有特定功能的酶以提高催化效率方面表现出色。
酿酒酵母作为模型微生物在酶进化方面也具有显著优势。它被用于从海洋栖热菌中进化出有效的色氨酸合酶,这种酶在其天然宿主中的表现并不理想。通过使用 OrthoRep 技术,酿酒酵母能够引入大量遗传变异,进一步推动酶的进化,提高色氨酸合酶的效能。这一技术证明了酿酒酵母在优化细菌酶方面的有效性。
除了大肠杆菌和酿酒酵母,非典型宿主在酶工程和代谢工程研究中也越来越受到重视。例如,工业酵母(如K. lactis 和 P. pastoris)在高密度培养和高产量生产中表现优越,适用于蛋白质的生产和修饰。细菌物种(如Bacillus subtilis 和 Corynebacterium glutamicum)在氨基酸和其他代谢产物的生产中也展现了优势,适合于大量产物的工业应用。而非模式微生物(如极端嗜热菌和极端嗜酸菌)则能够在极端环境条件下展现出独特的酶特性,适用于特殊工业应用。研究人员正在不断拓展非典型宿主的应用范围,并优化宿主选择,以实现更高效的酶工程和代谢优化。总之,大肠杆菌和酿酒酵母继续在酶工程中发挥重要作用,但非典型宿主的使用正在增加,为研究人员提供了更多选择和灵活性,以应对各种生物工程挑战。
虽然这些例子说明了完善的微生物宿主的价值,但有些涉及反应底物、中间体和产物的酶和途径需要更强大的宿主生物来进行体内工程。因此,在以不断变化的物理化学条件为特征的生境中茁壮成长的环境细菌,具有多种非生物和生物因素(例如,存在压力源、盐度水平、 pH 值和与其他微生物的相互作用)在塑造其生理和代谢方面发挥作用,可能是未来体内工程项目的合适宿主。
假单胞菌是一种非致病性革兰氏阴性土壤细菌,是微生物表现出“内在”稳健性的典型例子,这种稳健性源于它能够定殖的极端环境。假单胞菌已在代谢工程中用于多种应用,特别是对于需要使用溶剂或有毒底物和产物的生物过程。尽管基于生长耦合策略的选择方案已在 P. putida 中实施,但采用该细菌作为酶体内进化的宿主仍是一项相对未被探索的事业。P . putida 可能是产生芳香醛和其他类似反应中间体的酶进化的一个有吸引力的选择,因为这些化学物质是其天然生物化学的一部分,例如,作为芳香族外来化合物降解途径中的代谢物。此外,P. putida KT2440 中的天然代谢结构倾向于以 NADPH 的形式分解代谢过量生产还原力,这可以进一步支持需要大量氧化还原货币的进化反应。
类似地,可以利用其他具有与自动化体内工程过程相关的特性,但在大肠杆菌或酿酒酵母中不存在的菌株。海洋细菌 Vibrio natriegens 是迄今为止描述的生长最快的微生物。与目前使用的模型物种相比,它在丰富培养基上只需要不到 10 分钟的时间便可完成一次繁殖,这或将加速自动化体内酶工程。由于该细菌已有多种遗传工具可使用,包括具有不同启动子、核糖体结合位点和抗性标记的质粒、调控元件,以及通过自然转化进行多重基因组编辑的系统,因此在不久的将来,它很有可能成为体内酶工程的基础。
鉴于可用于菌株驯化的合成生物学工具日益丰富,选择任何天然适合处理待改进或进化反应的目标细菌并将其用作自动化体内酶)工程的基础并非不可想象。这种方法可以通过将给定的酶工程宿主直接用作生产菌株来扩展;例如,嗜盐细菌(Halomonas bluephagenesis ) 可用于生成改良的酶,将其应用于高盐培养基中,把藻类生物质转化为所需的增值产品。同样,嗜热细菌可用于进化热稳定酶变体。此外,在体内酶工程过程中,使用能够自然产生目标酶所需辅因子的细菌可能会有益。相关的例子包括辅因子,如吡咯喹啉醌 (PQQ;脱氢酶中的氧化还原辅酶) 或血红素 (携氧或电子转移的辅酶)。PQQ 是假单胞菌或甲基杆菌中醇脱氢酶的常见辅酶;虽然大肠杆菌中存在血红素生物合成途径,但其他细菌,如金属还原的希瓦氏菌,有更多需要这种辅酶的酶。
酶的体内定向进化的工作流程可以通过生物工厂的自动化装置来执行。事实上,从特定的传感器菌株开始提出的体内酶工程工作流程,到整合一个有效的模块来恢复和促进细胞生长的任务,可能需要在组合装置中测试不同的 DNA 元件。尤其是当模块在一个反应序列中包含两种或两种以上的酶时,需要对底层基因的表达进行精细调控,以实现平衡的高碳通量,从而最大化生长率。后者取决于功能性转录单元中多种 DNA 元件(即启动子、核糖体结合位点、目的基因、终止子)的正确组合,并且随着复杂性增加,要测试的菌株构建体的数量可能会迅速增加。为了在合理的人力、物资和时间投入下应对这一挑战,菌株工程工作流程的标准化、小型化和自动化至关重要。
全球各地新兴的生物制造平台正在提供自动化功能来建立此类工作流程,通过引入和整合现有的模块化 DNA 组装、高度并行的转化和孵育、基于图像的菌落识别和多针挑取等方法,以及使用典型宿主(如大肠杆菌或酿酒酵母)作为基础的质粒文库制备,为建立这样的工作流程提供自动化能力。最近,机器人辅助的模块化克隆、高通量转化、单克隆菌落培养和挑取已被引入用于其他工业相关生物,如假单胞菌或谷氨酸棒状杆菌。使用菌落 PCR 或 Oxford Nanopore 测序可以高通量地轻松验证组装和克隆的质粒的正确性。
下一步,将使用所得的第一代选择菌株与 MAGE 或其他体内高变异体进行有针对性的多样性生成,其中相同的标准化模块可以集成到自动化工作流程中。最重要的是,可以采用 ML 方法实现对组合诱变文库的酶适应度景观的自主探索。同样,通过将自动化微生物反应器平台与适当的数据处理工具相结合,可以对生成的第二代传感器菌株进行可靠的自主生长表型分析。
如上所述,ALE 是另一种重要工具,可充分利用传感菌株的遗传多样性并富集表现最佳的变体。根据所需的规模、通量和额外的选择压力,ALE 技术可用于实验室规模、小规模和单细胞水平的自动化操作。RNASeq 技术的自动化也增强了对生成的有益突变或激活的潜在酶活性的全基因组识别。最后,为了确认模块活性并识别应被失活的竞争路径,可以结合高度信息量和准确的 LC-QToF 质谱进行小型化和自动化的 13C-/15N 标记实验。
上述技术可以组合成一个自动化的、机器学习引导的流水线。我们设想,如果能够体内诱变与生长耦合选择的筛选能力相结合,将提高生物工厂用于酶工程活动的通量。从技术角度来看,仅靠一个大型单一平台当然不可能实现所示的流水线,我们需要组合多个定制的机器人平台,通过移动机器人单元连接起来,最终实现分布式工作流程和复杂的调度。此外,将特定设备(具有不同的接口)集成到液体处理站、建立功能性和资源高效的克隆工作流程、以及实现灵活且用户友好的数字基础设施以运行自动化实验(包括实时数据处理以实现闭环)方面,目前仍然存在许多缺陷。
首先设计阶段包括确定感兴趣的基因(GOI)和优化目标,选择适当的核糖体结合位点(RBS)和其他关键设计元素。接着进入构建阶段,生成基因组或质粒,实施体内或体外诱变策略(如MAGE、MutaT7、OrthoRep、EvolvR)。随后进行测试,通过生长耦合选择或其他体内测试方法评估变体的酶活性,并结合机器学习(ML)分析实验数据以优化测试过程。最后在学习阶段,分析测试结果,识别成功的变体和改进点,基于学习到的信息调整设计和构建策略,进行迭代优化。尽管面临挑战,自动化实验室技术的前景被广泛讨论,未来有望扩展到更高效的自动化实验室,以推动生物催化剂的开发和优化。
本文探讨了体内诱变与生长耦合选择策略结合的优点,并认为结合机器学习引导的自动化将加速未来的酶工程。然而,这些方法也面临一些挑战。例如,生长耦合选择有检测阈值的限制,可能无法检测到酶活性较低的情况。为了克服这一问题,可以使用基于转录因子的生物传感器,并结合自动化技术如 FACS 进行筛选。同时,选择菌株可能诱导非特异性代谢途径或产生绕过选择的突变,因此在选择菌株后需要进行生理表征,并使用 RNAseq 或蛋白质组学数据识别可能的靶点。此外,生长耦合选择不适用于对映选择性酶或活性不易与生长耦合的酶。使用体内超突变体时,某些技术可能对特定突变类型存在偏见,这可能限制了序列空间的全面探索。
作者简介
WRITER
丁小然
范锐
负责再创栏目策划与内容制作,再创社群管理
\ END \