《Science》从自然到工业:利用酶进行生物催化

文摘   2024-08-15 22:03   江苏  

2023年11月,瑞士的R.Buller等人在Science上发表了一篇题为From nature to industry: Harnessing enzymes for biocatalysis的综述。



通讯作者:T.Bornscheuer
通讯单位:Institute of Biochemistry, Dept. of Biotechnology and Enzyme Catalysis, Greifswald University, Greifswald, Germany


Abstract

生物催化利用酶来制造有价值的产品。这种绿色技术被应用于从实验室规模到工业生产的无数领域,它使从业者能够获得复杂的有机分子,而且通常需要更少的合成步骤和更少的浪费。在过去十年中,用于定制酶特性的实验和计算工具的发展呈爆炸式增长,使酶工程师能够创造出执行自然界中不存在的反应的生物催化剂。通过使用(化学)-酶合成途径或协调复杂的酶级联,科学家可以合成复杂的目标,从DNA和复杂的药物到由二氧化碳衍生的甲醇体外制成的淀粉。此外,通过将生物催化与过渡金属催化、光催化和电催化相结合,出现了新的化学反应。本综述重点介绍了近期的关键进展,指出了当前的局限性,并为这项快速发展的技术提供了未来前景。




01

简介


为了在合成化学领域进行创新,学术和工业科学家越来越多地应用酶来制造简单和复杂的功能化(生物)分子。受酶对反应结果进行精确控制的启发,化学家们正在利用生物催化转化来补充甚至替代更传统的化学途径。然而,由于合成相关的反应在自然界中很少有对应反应,生物催化的挑战在于确定适合所需应用的酶催化剂。生物催化的早期应用依赖于食品或其他行业中可用的野生型酶,用于生产洗衣粉、半合成抗生素和制药行业的简单手性前体。尽管这种重新利用仍偶尔发生,但大多数新的应用需要发现具有不同反应性的酶或对现有酶进行工程改造,以催化所需的反应,接受所需的底物,并在所需的应用条件下保持稳定和活性。过去几年计算和实验的进步加速并简化了生物催化剂的定制,以实现快速增长的化学转化。如今,开发高效生物催化剂的策略包括筛选自然多样性以发现所需的酶活性、设计生物催化剂以改变底物范围、重新设计机制以创造以前未知的反应性,以及通过计算从头设计酶(图1)。这些策略现在使该领域能够更大胆地选择尝试酶促反应。生物催化剂正在被重新设计、重新构想和重新利用,以便高效地实现所需的目标。

图1. 生物催化剂开发策略。(左上)从环境样本或酶库中筛选自然多样性有助于发现所需的酶活性。(右上)定向进化从一种对所需反应有少量表现的酶开始,并调节该酶使其在所需的反应条件下发挥良好作用。通过定向进化进行底物行走扩展了这种能力,它从一种在机械上能够催化所需反应(但实际上并不催化该反应)的酶开始,并设计该酶在目标底物上执行反应以产生所需的产物(即改变其底物范围)。(左下)重新设计酶机制利用化学直觉来创造新的化学功能——例如,通过辅因子重新利用和添加新的辅基。(右下)计算机设计使惰性蛋白质结构具备酶功能。除非另有说明,所有图片均来自stock.adobe.com。带圆圈的图像,从左下方开始顺时针方向:图像1和2,ylivdesign;图像3,Lifeking;图像4,ylivdesign。方框中的图像,从左下方开始顺时针方向:方框1,作者;方框2,图像1至3(从左到右)由davooda提供,图像4由SkyLine提供;方框3,Lifeking;方框4,作者提供。

在这里,我们评估了导致生物催化及其应用推动的最新实验和计算发展(图2)。突出的实验创新包括读取和写入DNA的优化策略、用于自动化和高通量筛选的先进工具,以及将新型催化元素(包括非规范氨基酸)掺入酶的能力。计算的进步体现在对合适的酶编码序列的获取的改善、基于机器学习的方法来准确预测蛋白质结构,以及数据驱动的工具来指导酶工程创建信息丰富的功能变体库。这些成果已转化为多种应用,包括(化学)酶级联反应、新自然化学、酶促塑料降解以及生物制剂和治疗剂的合成(图2)。

图2. 实验和计算工具的进步拓宽了生物催化的应用范围。除非另有说明,所有图片均来自 stock.adobe.com。从左下方开始顺时针方向:图片1(生物制剂和治疗学),Sir.Vector;图片2,作者提供;图片3和4,ylivdesign;图片5和6,Artco;图片7,ylivdesign;图片8,muhamad;图片9,ylivdesign;图片10,davooda;图片11,Artco;图片12,RaulAlmu;图片13,ylivdesign;图片14,Skyline。





02

具体内容


2.开发生物催化剂

有几种方法可用于寻找或创建具有所需催化活性的酶(图1)。首先,目标活性可能存在于自然界中,但需要被发现。高质量、低成本的DNA测序现已揭示来自世界各地物种的完整基因组,以及来自宏基因组样本的DNA片段。过去5年中,可用的蛋白质序列数量增加了20多倍[2023年,>24亿;2018年,约1.23亿]。搜索这些序列会发现许多推定的酶,其中一些具有可预测的活性,而许多则具有未知的功能。将这些序列数据与序列相似性网络、系统发育分析和蛋白质结构预测等计算工具相结合,可以提高搜索的精度。

一个代表性的例子是,通过经典筛选、生物信息学搜索和环境样品测序发现了可降解PET塑料的聚对苯二甲酸乙二醇酯(PET)水解酶(PETases)。或者,过去被证明有用的酶的遗留酶集合对于识别合适的生物催化剂或工程项目的高级起点来说是宝贵的资源。市售的酶筛选试剂盒和常用酶(例如脂肪酶、酯酶、酮还原酶和转氨酶)的酶变体私人库可以大大缩短产生具有所需目标活性的生物催化剂的时间。最近,蛋白质结构预测的进展(见下面的“计算工具”部分)进一步改善了在序列数据库中寻找合适的酶。例如,在搜索脱卤酶时,序列相似性搜索确定了2905种推定的目标酶。随后对同源模型进行分析——考虑了活性位点的大小、催化残基的存在以及进入活性位点的通道——将搜索范围缩小到45个基因,其中40个基因产生了具有催化活性的脱卤酶。

获得所需酶功能的最常见策略是重新利用现有的酶,以满足新应用的许多(但不是全部)要求。现有的酶常常催化所需的反应,但不能接受所需的底物,或不能产生所需的产物异构体。在这种情况下,需要进行蛋白质工程来改变酶的底物或产物偏好。例如,重新设计天冬氨酸酶使α,β-不饱和羧酸发生氢胺化,生成β-氨基酸。目标底物在天冬氨酸的α-羧酸盐对应的位置上含有疏水性取代基,该设计将结合位点上的四种主要为极性的氨基酸替换为疏水性氨基酸。在另一种情况下,由于需要选择性卤化反应,研究人员扩大了Fe(II)/α-酮戊二酸依赖性卤化酶的底物范围,以包括非天然底物,如强效杀菌剂大环内酯类soraphen A。通过使用算法辅助工程,soraphen的表观周转数(kcat)提高了100多倍,使卤化酶成为一种适合用于药物化学结构-活性关系研究的催化剂。卤化酶还可以接受其他阴离子,包括叠氮化物、硝酸盐和亚硝酸盐,从而能够产生更广泛的产品。在另一个例子中,蛋白酶的选择性被改变以降解麸质肽,作为乳糜泻患者的潜在补充剂。起始蛋白酶倾向于在Pro-Arg/Lys序列之后进行水解,而麸质含有许多Pro-Gln-Gln/Leu序列。需要在Gln和Gln/Leu残基之间进行水解。研究人员引入了八处替换,其中两处位于新的Gln位点,一处位于Gln/Leu位点,另外还有五处较远的替换,以稳定蛋白质。改造后的蛋白酶目前正在进行临床试验。

十多年前,“底物行走”的概念——酶从转化天然底物进化为接受工业相关底物的过程——很少被应用。用于生产西他列汀的转氨酶的进化是一个早期的例子。如今,使用苯甲醛的Pictet-Spengle酶,以高分子量吲哚和咔唑为活性的黄素依赖性卤化酶,使用胺和酮而非氨基酸和酮酸的冠状脱氢酶(还原性氨基酶),以及使用非极性芳香族底物的转酮酶,均已通过底物行走创建出来。

在更困难的情况下,不存在具有所需反应性的酶,但已知具有机制相似催化活性的酶。将化学推理与蛋白质工程相结合,可以将天然催化活性扩展到所需活性。其中一个例子是扩大细胞色素P450单加氧酶的催化范围以催化卡宾和氮宾反应。他们的氧化酶机理涉及铁卟啉氧代(Fe=O)中间体,因此可以推断,在适当的反应底物存在下,铁卡宾[Fe=C(R1)(R2)]和铁氮烯(Fe=NR)物质可能会以类似的方式形成。初步实验表明反应效率低下,但通过定向进化进行优化,用供体功能较弱的丝氨酸替换近端硫醇血红素配体(得到所谓的P411支架),得到了能够进行新自然化学反应的催化剂,包括环丙烷化、环丙烯化、Si-C键形成、B-C键形成、C-H插入和烷基转移(图3),以及氮杂环丙烷化、硫化物酰亚胺化、C-H酰胺化和C-H胺化(图3)。这些例子是体外酶催化反应,但这种新天然的卡宾转移化学也用于延长体内生物合成。工程链霉菌菌株生物合成了卡宾转移试剂、重氮丝氨酸以及受体苯乙烯,从而产生了非天然环丙烷。P450单加氧酶也可以通过其他策略重新利用。例如,Labrenzia agreggata的P450单加氧酶被改造成酮合酶,能够利用高活性碳正离子物质作为关键中间体,将内部芳烯烃直接氧化为酮。再举一个例子,研究人员发现,可以利用金属氧化还原策略开发基于P450的自由基环化酶,以催化立体选择性原子转移自由基反应,生成取代的γ-内酰胺或芳烃。

3. 重新设计酶机制的例子。(A)(顶部)野生型细胞色素P450单加氧酶催化的氧化反应。Fe氧烯和Fe氮烯的结构相似性启发人们使用合成试剂对经过改造的P450酶进行新的化学反应。。(左下)这些所谓的P411酶含有丝氨酸残基作为近端配体(表示为X),通过sp3 C−H官能化组装C−C键,并在苄基和烯丙基(未显示)位置进行胺化,得到(右下)对映体富集的未保护的一级胺。Piv,新戊酰基;Tf,三氟甲磺酰基。(B)(左上)烯还原酶催化的不对称双键还原,通过黄素单核苷酸(FMN)的氢化物转移(双电子转移),再通过保守的酪氨酸残基(未显示)的质子转移。通过应用光催化,当使用自由基前体作为底物(如此处所示的α-氯酮)时,烯还原酶的催化机制可以重新利用。EWG,吸电子基团。(右上)在设计的Diels-Alderase催化下,4-羧基苄基-反式-1,3-丁二烯-1-氨基甲酸酯与N,N-二甲基丙烯酰胺发生热允许的[4+2]环加成反应。(左下)辐射引发黄素对苯二酚辅因子的单电子转移,并促进α-酮基自由基的形成,该自由基可以在工程酶支架范围内进行立体选择性sp3-sp3交叉亲电偶联。(右下)通过遗传密码扩展安装非规范氨基酸4-苯甲酰苯丙氨酸(绿色)扩大了Diels-Alderase的反应范围。在设计酶的照射下,ncAA允许三重态能量转移至适当选择的底物,从而实现热禁阻反应,例如具有高立体选择性的分子内和双分子(未显示)[2+2]环加成反应。结构图改编自PDB(PDB ID:2IJ2,细胞色素P450BM3;7TNB:烯还原酶;3I1C:Diels-Alderase)。

催化活性的变化也可能更为剧烈;例如,还原酶延伸为通过自由基中间体形成C-C键的环化酶。依赖黄素的“烯”还原酶通常通过逐步添加H2来催化电子活化烯烃的还原-第一步是通过黄素对苯二酚的氢化物转移(双电子转移)进行的,然后是第二步,即从保守的酪氨酸残基的质子转移(图3)。在其他酶中,黄素通过两次单电子转移还原底物,从而产生自由基中间体。通过用自由基前体α-溴酮取代烯还原酶的活化烯烃底物,烯还原酶改变了其机制并转移了一个电子。溴化物快速损失产生相应的α-酮基自由基。在适当选择的底物中,该自由基可环化,形成C-C键并从黄素半醌中夺取氢原子。周围的活性位点引导产物中新立体中心的形成。因此,所得反应是对映选择性还原环化。

在其他情况下,自由基前体的反应性较低,需要光照射来启动单电子转移。在光生物催化中,蛋白质活性位点内的辅因子或氨基酸被光激发,以促进将起始材料转化为所需产物所需的电子或能量转移。只有三种天然酶遵循这种合成逻辑:脂肪酸光脱羧酶、DNA光解酶和原叶绿素还原酶。尽管后两种酶与合成的相关性较小,但脂肪酸脱羧酶已被研究用于催化脂肪酸的加氢脱羧,这是一种生成烷烃的氧化还原中性反应,这使得它们成为生物燃料生产和化学构件合成的有希望的催化剂。

除了精心选择的有机卤化物的自由基环化之外,光生物催化方法还可以实现芳烃的烷基化,烷基卤化物和硝基烷的不对称交叉亲电偶联(图3),以及通过生成酰胺基自由基进行氢胺化。非酶光氧化还原催化剂也能为酶产生底物,从而产生新的反应。添加基于氧杂蒽的光催化剂使烯还原酶能够催化对映选择性脱乙酰氧基化。在另一个例子中,使用单独的光催化和酶促步骤合成非规范氨基酸。光催化从烷基三氟硼酸盐前体产生烷基自由基。在相同的溶液中,修饰的色氨酸合酶催化丝氨酸脱水,形成酶结合的吡啶氧基-5′-磷酸氨基丙烯酸酯中间体。自由基淬灭和中间体的释放产生非典型氨基酸。调节活性位点的形状可微调所有所述反应的对映选择性,最多可达到三个立体中心。

研究人员并没有修改或扩展现有的酶活性,而是通过计算将新的催化活性设计到蛋白质支架中。这种从头设计方法可以识别所需转化的过渡态,然后构建结合位点来稳定它,从而将生物催化问题简化为分子识别问题之一。尽管从头设计酶已经为模型转化创造了蛋白质催化剂,包括质子转移、双分子醇醛和狄尔斯-阿尔德反应。设计催化剂的初始活性较低,但定向进化提高了它们的催化活性。例如,经过设计的逆转醛酶的定向进化,其催化活性从几乎检测不到提高到与天然酶相当。定向进化引入了31个替换,导致活性提高了数百万倍。最近,基于深度学习的方法生成了大量理想化的蛋白质结构及其编码序列。采用多种支架来设计人工荧光素酶。通过位点饱和诱变引入的三个替换产生了比母体设计高100倍的光子通量(kcat/Km=106M−1s−1)(其中kcat/Km是催化效率,Km是米氏常数)。从头设计具有与天然酶相媲美的活性的酶目前仍然是一个重大挑战,但这些研究提高了我们对序列如何折叠成蛋白质以及如何产生基本酶活性的理解。随着我们对酶中序列功能关系的理解不断加深、蛋白质设计方法不断成熟以及计算能力的提高,从头酶设计将继续增长。

3.实验工具

无论选择何种策略来识别合适的生物催化剂,总是需要实验室工作来生产并在必要时定制目标酶。蛋白质工程师可用的实验工具范围在不断扩大,无论是通过降低合成基因的成本,加速个体定向进化周期,还是允许引入新的催化元素添加到蛋白质中。

生物催化剂的开发始于编码目标酶的 DNA 构建体,这需要人工 DNA 合成。目前的DNA合成使用40年前开发的亚磷酰胺化学;然而,用酶进行的DNA合成可以产生更高质量的DNA,并且可能更快、更便宜,因此其本身就代表了一种生物催化解决方案。末端脱氧核苷酸转移酶(TdTs)(图4)以不依赖模板的方式将脱氧核苷三磷酸(dNTPs)聚合到DNA序列的3′端。使用3'-羟基被阻断的dNTP可在单个核苷酸掺入后停止TdT作用,从而控制失控的聚合。天然TdT与阻断的dNTP反应缓慢,因此针对此应用设计了改进的TdT。基于TdT的方法已将DNA寡核苷酸合成推向(字面意义上)长达1000个核苷酸的新长度,并使掺入效率达到99.6%以上,从而重新点燃了快速、单次全基因合成的希望。更温和的水反应条件也有利于提高DNA质量并极大地提高了整个过程的可持续性,为基因编辑和诊断应用开辟了机会。TdT还可以组装短合成RNA片段。此类序列除了包含标准RNA结构单元外,还包含经过修饰的核苷酸,具有作为反义寡核苷酸和小干扰RNA的巨大治疗潜力。

4. 定向进化方法的建模。单点突变的递归积累,例如由易错PCR方法产生的突变,可产生2N量级的适应度改进(浅蓝色曲线)。在进化中添加重组技术可将适应度积累提高到2.75N(26)和4N(122,152)之间(虚线),平均约为3.2N(粉色曲线)。无细胞表达技术提高了进化周期的完成速度(绿色曲线),而连续进化技术估计可以更快地加速点突变的积累(长春花曲线)。基于微流控技术的超高通量筛选每轮可实现100倍的改进。N表示进化周期数。在本概述中,假设每月可进行一次进化周期。

尽管酶促DNA合成技术取得了进展,但大多数实验室仍然依赖传统的分子生物学策略,通过易出错的聚合酶链式反应(PCR)等方法创建大型随机文库,或使用化学合成的基因作为模板通过定点诱变构建一些特定变体。使用这些传统方法构建预定义酶变体库仍然成本高昂且具有挑战性。“寡核苷酸池”由几百到1000个不同的多核苷酸组成,长度约为300个碱基对,是一种较便宜的替代解决方案(每个核苷酸0.00001到0.001美元,具体取决于长度、规模、平台或供应商)。尽管存在截短的DNA分子和高错误率等缺点,寡核苷酸池选项可能比通常用于文库构建的简并引物或降低密码子覆盖率的引物更具成本效益,并且可以允许更灵活的文库设计。

蛋白质工程的基石、获得诺贝尔奖的定向进化策略,很大程度上依赖于这种随机基因库。三十年前,当定向进化出现时,易错的PCR是序列变异的驱动因素,导致单个突变在一轮又一轮的进化中积累,酶性能在每一轮进化中大约提高一倍(图4,浅蓝色曲线)。同时加入的重组技术通过每轮引入多个突变,将改良率提高到每个进化周期2.75到4之间(图4,虚线),反映了过去二十年的技术水平。计算和分子生物学的研究已经改善了突变预测并加速了酶变体的产生,从而可以减少筛选负担,但并没有达到筛选周期或每个周期的改进与这些历史规范发生很大改变的程度。此外,蛋白质工程师继续增加尝试进化活动的复杂性。总体而言,这些发展表明生物催化领域的瓶颈日益突出:对蛋白质工程资源的需求越来越大,而进化实验的进行方式却缺乏改进。然而,技术创新即将到来。无细胞蛋白质表达技术提供了将许多DNA序列转录和翻译成功能性蛋白质所需的所有必要成分,从而避免了细胞转化、生长和诱导等耗时的步骤。利用该技术生成用于进化实验测试的酶库,有可能将完成一轮进化的时间加快约1.6倍(图4,绿色曲线)。转向生物世界,持续进化策略将所需酶活性的成功与生产微生物的生长速度联系起来,同时为微生物提供一种仅向编码所需蛋白质的DNA中引入突变的机制。所需蛋白质的进化随后在连续培养中进行,这避免了无细胞蛋白质表达所需的相同实验室操作,此外还避免了人为构建新的变体文库,与容易出错的PCR相比,进化性能的速度提高了八倍[与目前最先进的技术相比,提高了五倍(图4,长春花曲线)]。例如,mRNA展示文库已经产生了新的蛋白质、新类型的催化活性以及对其靶标具有非常高亲和力的结合蛋白。同样,微流体技术已经证明了筛选大型文库的能力,这积极改变了定向进化实验的性质(图4,黑曲线)。将细胞封装到皮升大小的液滴中,并配有裂解试剂和分析读数,使得科学家能够每秒检测数千个样本,这与荧光激活细胞分选(FACS)技术达到的速度相当。由于可以分析数百万个样本,因此可以对每个序列具有多个突变的文库进行足够深入的筛选,以发现罕见事件,从而实现每轮进化100倍或更多的改进。尽管迄今为止,由于缺乏商业化硬件、相对较高的实施成本以及技术复杂性,此类工具的使用仅限于专家从业者,但这些策略有望管理日益复杂的目标所需的更长的演进时间线。

其他在蛋白质工程中有用的新兴工具包括低温电子显微镜(cryo-EM),它已被成功用于指导腈水解酶的改进,以及微晶电子衍射(MicroED),它支持对设计蛋白质中卡宾转移的机制研究。这两种方法都可以收集与X射线晶体学互补的机械见解和结构数据,但它仍然是生成高分辨率结构(尤其是较小的酶的结构)的重要工具。

作为对通过酶工程活动获得的生物催化剂的补充,一些应用需要研究人员为蛋白质配备新的自然功能。这是通过使用琥珀终止密码子抑制或混杂氨酰基tRNA合成酶(aaRS)掺入非规范氨基酸(ncAA)来实现的,这扩展了可用催化元素的范围,使其超出了20种蛋白质氨基酸中编码的元素。ncAA可以用来调整酶的特性,揭示复杂催化机制,并创造具有自然界中不存在的功能的酶。

通过掺入ncAA来调整酶特性的一个说明性例子是将Nd-甲基组氨酸(NMH)作为近端配体引入血红素蛋白抗坏血酸过氧化物酶,这导致周转数大幅增加,而不会影响催化效率。类似地,引入NMH会调节化合物II在细胞色素c过氧化物酶中的反应性,并增强肌红蛋白的混杂过氧化物酶和环丙烷化活性。最近,这种非典型亲核试剂被引入到为Morita-Baylis-Hillman反应设计的一种酶中。在进化过程中,NMH大大改变了进化轨迹,与之前设计的不包含新催化实体的酶相比,产生了活性高出一个数量级的变体。

安装酪氨酸类似物对于涉及自由基中间体的酶的机制研究是一种有价值的工具,其中此类残基可能发挥催化作用。在大肠杆菌核糖核苷酸还原酶或疣状原合酶(一种Fe(II)/α-酮戊二酸依赖性双加氧酶)活性位点的关键位置加入卤代酪氨酸类似物,使得能够使用电子磁共振等分析工具,从而对反应机制产生关键性的认识。

通过使用琥珀终止密码子抑制安装光敏剂,产生了一种催化光诱导[2+2]环加成的酶。在对非天然氨基酸4-苯甲酰苯丙氨酸(安装在从头设计的Diels-Alderase的活性位点上)进行照射后,三重态能量转移引发了热禁止的[2+2]-环加成反应。通过定向进化对酶进行微调,产生了一种对分子内和分子间反应均具有高对映选择性的催化剂(图3)。

4.计算工具

基于机器学习的结构预测工具有望限制分析定向进化过程中通常生成的庞大文库所必需的过度筛选或选择。DeepMind开发的高级统计系统AlphaFold2可以根据氨基酸序列预测蛋白质结构,其准确度比以前的方法高得多。AlphaFold2使用深度神经网络来预测氨基酸序列中的残基间距离。它的预测依赖于蛋白质数据库(PDB)(www.wwpdb.org)中的结构数据,其中包含200,000种蛋白质和核酸的三维结构。神经网络假设数据库中频繁出现的子结构比不存在或很少出现的子结构更稳定。目前,预测结构数据库(https://alphafold.com/)包含超过2亿个条目,并且还在不断增长。同样有用的替代方案是Meta Platforms创建的RoseTTAFold和ESMFold。

结构预测有可能揭示目标酶活性位点残基的排列,从而指导酶的优化。然而,酶的功能也需要底物结合和产物释放,并且通常依赖于辅因子或金属离子。AlphaFill和DiffDock等工具将缺失的有机分子和金属离子投射到蛋白质口袋中,从而提供可能更准确反映所需化学性质的模型。为了捕捉运动,AlphaFold2可以通过降低作为算法输入的多重序列比对的深度来近似构象异质性,正如研究人员使用AlphaFold2创建色氨酸合酶替代构象模型时所证明的那样。

经过训练的深度神经网络可以根据氨基酸序列预测天然蛋白质的结构,进而可以设计新的蛋白质。第一步是预测随机氨基酸序列的结构,这将产生部分结构具有可信预测,而其他部分具有不确定预测。对不确定区域的氨基酸序列进行反复修改,最终得到一个整个结构都可以可信预测的序列。测试这些预测通常会产生结构接近预测的稳定蛋白质。这些用于蛋白质设计的神经网络方法比基于物理的方法(如Rosetta Match、Rosetta Design和Rosetta Ligand)更快,因为它们不尝试优化诸如侧链包装之类的相互作用。然而,神经网络方法缺乏Rosetta等方法的物理透明度。在蛋白质设计中添加经过蛋白质训练的扩散模型(类似于用于生成图像的Stable Diffusion或用于生成文本的ChatGPT)扩大了生成的设计的数量和种类,从而增加了成功的机会。此外,语言模型可以生成跨不同家族的功能性蛋白质序列。

尽管蛋白质结构的设计正在不断改进,但具有催化功能的蛋白质的设计仍然具有挑战性。设计通常会产生效率低下的酶,然后需要通过定向进化进行大量优化(参见上文“实验工具”部分)。这可能是因为高效催化需要比目前算法所能实现的更精确的催化基团定位。造成这一问题的另一个原因是对催化所需的结构特征(包括运动)的理解不完整。利用 X 射线晶体学进行经典的蛋白质结构测定,使用过渡态类似物或自杀底物来揭示底物如何与酶的活性位点结合,了解结合位点的位置,并收集有关有助于催化的蛋白质运动的信息。例如,尽管已有几种脂肪酶的 X 射线结构显示出埋藏的催化位点,但脂肪酶在油水界面上更高催化活性的结构基础仍然是一个难题。1991年,Brzozowski等人通过脂肪酶结构解决了这个难题,该结构显示覆盖催化位点的螺旋盖子发生了剧烈运动。一个较新的难题是单胺氧化酶,其X射线结构也显示出封闭的构象,无法解释突变对催化活性和底物范围的影响。在这种情况下,采用长期分子动力学的计算方法,确定了可以解释催化变化的部分和完全开放构象。当前的结构预测工具在大多数情况下不包括蛋白质动力学,同样也不包括有关二硫键和翻译后修饰的信息(数据库中的蛋白质序列通常不涉及这些信息),例如糖基化和乙酰化,因此需要使用互补的计算工具和实验。

将蛋白质结构与蛋白质功能(如反应性或选择性)联系起来是机器学习的一个前沿领域。基于蛋白质结构的神经网络和基于使用对比学习的序列的神经网络都提高了预测蛋白质功能的可靠性。在许多情况下,机器学习在蛋白质催化特性中的应用受到缺乏可靠的实验数据来训练神经网络的限制;最近,EnzymeML数据库的建立是为了解决这个问题。在特殊情况下,当测量了数万种蛋白质变体的特性后,机器学习可以预测具有改进结合特性的变体。利用计算建模预测的数据也有助于机器学习方法设计更具选择性的酶。

酶设计的另一个挑战是预测远距离氨基酸替代的影响。实验表明,这些残基会影响催化作用,因此它们的预测对高效酶的设计至关重要。这些残基距离太远,无法直接与底物相互作用。它们可能通过多米诺骨牌效应发挥作用,因为蛋白质会弯曲和移动,从而改变活性位点内催化残基和底物的定位和灵活性,类似于变构效应。一种很有前途的计算方法是利用最短路径图来捕捉相关远距离残基的影响。从分子动力学模拟开始,该方法识别一起移动并与催化残基相连的残基。当应用这一策略时,远距离替代消除了色氨酸合酶B的变构活化,从而永久激活了它。

5.应用

将几种工程酶组合成级联可产生新的生化途径。最近的例子(图5)包括药物的合成——例如环状二核苷酸ulevostinag、molnupiravir、islatravir和ikarugamycin——以及用于制造新型胰岛素的生物结合物,以及人工甜味剂。CO2固定途径能够通过CETCH循环产生化合物,甚至从CO2衍生的甲醇合成淀粉,是复杂工程途径的进一步例子。

在香料行业中,(-)-Ambrox具有琥珀和木质气味,是最广泛使用的可生物降解香料成分之一。之前合成(–)-Ambrox(商品名为Ambrofix)的方法是采用多步路线,从快乐鼠尾草中分离出的二萜香紫苏醇开始。一种新的一步法工艺采用生物合成生产的高法呢醇,使用工程化的角鲨烯-藿烯环化酶(图5)。

酶级联的另一个例子是Bristol Myers Squibb和Codexis于2023年初报道的将烯丙基酮3-氧代环己烯-1-羧酸盐通过一锅法、双酶还原为相应的饱和醇。烯还原酶(ERED)和酮还原酶(KRED)工艺表现出较高的对映体和化学选择性。辅因子再生系统的兼容性和避免副反应可实现最大产品产量。另外,在工艺条件下,底物抑制和酶的稳健性得到改善,以提供可扩展的酶级联,同时大大减少合成步骤数,提高总体产量,并降低工艺质量强度(PMI)(环境影响指标)从初始化学路线的2017值降低到仅为170的PMI。

利用逆合成工具(有机化学家几十年来一直使用的断开方法)来规划合成路线,新型酶级联的开发变得简单起来。程序(例如,RetroBioCat)确定了多步生物催化反应的可能途径,同时考虑到商业可用性、辅因子要求和溶剂耐受性等方面。机器学习也可以帮助实现这一目的。同样,代谢途径规划可以预测通往复杂天然产物以及1,4-丁二醇等简单分子的途径。

针对更难治疗的靶点开发药物会导致分子中手性中心数量不断增加、超越5规则的支架和生物共轭物(例如放射治疗剂、反义寡核苷酸治疗剂和抗体-药物共轭物)。为了解决这些合成(以及后续制造)挑战,需要找到酶工具来生产这些复杂的支架。例如,据报道,利用工程化的青霉素G酰化酶可以选择性酰化胰岛素的三个氨基(两个氨基末端或内部赖氨酸残基)。这些酶变体能够以可编程方式安装可裂解的苯乙酰胺保护基,同时留下一个或多个氨基不受保护,以便进行后续化学修饰。高酶区域选择性提高了胰岛素结合物的整体纯度和产量(图5)。

尽管修饰寡核苷酸的化学合成方法已经很完善,但以可持续且经济可行的方式进行大规模生产仍然具有挑战性。随着寡核苷酸长度的增加,化学偶联效率的误差会累积。一些公司和学术实验室已经开发出酶促组装化学修饰寡核苷酸的技术。该方法利用众所周知的RNA连接酶催化活性,在两个寡核糖核苷酸的3′-OH和5′-PO4末端之间形成三磷酸腺苷(ATP)依赖性共价键,从而形成一条更大的连续链。最近的方法描述了使用这种RNA连接酶从短(≤9个核苷酸)寡核苷酸片段开始合成化学修饰的RNA,转化率为40%至80%。

一种针对寡核苷酸的正交酶促方法采用了以催化量添加的自引发(发夹状)模板。DNA聚合酶在核苷三磷酸(NTP)构件存在的情况下扩增互补序列。特定的核酸内切酶会切割新合成的链,然后释放模板以进行下一个催化循环。该合成使用水中未受保护的构件,无需大量乙腈(固相合成中通常需要大量乙腈),从而解决了重大的可持续性挑战。不受保护的NTP是否能够以可接受的时间和成本在足够大的规模上采购,从而将这一概念完全嵌入制造规模,还有待观察。然而,鉴于非天然单核苷和双核苷(例如ulevostinag,图5)的酶促合成成功,生物催化生产可被认为是可行的。

酶还可用于解决塑料污染问题。自1950年代以来,全球已生产了近90亿吨塑料,废塑料是全球主要的环境问题。人们做出了相当大的努力来利用生物催化方法降解和回收商用塑料,特别是聚酯、聚酰胺和聚氨酯,因为关键的化学键可以水解产生相应的单体,可以用来制造新的原始聚合物。据报道,PET回收工艺最为先进。合理的设计方法创建了叶枝堆肥角质酶(LCC)的四重突变体,其效率足以建立目前在工业规模上实施的稳健工艺(图5)。在最近的一个例子中,利用机器学习设计了一种来自Ideonella sakaiensis的PETase。目前的研究重点是聚酰胺和聚氨酯水解酶;第一个候选酶最近在宏基因组文库中被鉴定出来。

图5近期基于生物催化的产品的选定示例。示例包括生物治疗药物[工程化α-半乳糖苷酶A、胰岛素类似物和由TdT合成的寡核苷酸);潜在的大宗产品[由CO2合成的淀粉和从PET回收的塑料瓶);药品(molnupiravir、ulevostinag、islatravir、ikarugamycin和BMS-986278的中间体);以及香料Ambrofix。



03

结论


过去几年开发的先进工具加速了蛋白质工程的发展,使得酶成为传统有机合成催化剂的同等对应物,从而引发了生物催化在制药制造和许多其他领域的应用热潮。未来的酶工程还需要加快发现-设计-测试周期以保持发展势头并扩大对新酶类别的合成贡献。同样,需要将酶与其他(催化)合成化学方法(如过渡金属催化、光催化和电催化相结合,以应对人类面临的挑战,例如应对气候变化、降解塑料废物、过渡到可再生能源和开发新的医疗疗法。重新利用酶机制来拓宽生物催化反应的范围代表了在酶催化剂中创造所需活性的新概念。其他令人兴奋的新型酶反应性策略是从头酶设计和计算机“幻觉”。

十一年前,第三次生物催化浪潮推动了酶技术的发展,从“围绕酶的局限性设计生物催化过程,到设计酶以适应过程的规格”。现在,这项技术又迈出了一大步:酶工程师不再需要依靠酶的天然催化能力来定义可获得的化学物质,而是可以想出大胆的新的自然反应,并将其带入生物催化现实。





原文:From nature to industry: Harnessing enzymes for biocatalysis

DOI:https://doi.org/10.1126/science.adh8615


END



前期回顾


《Int J Biol Macromol》Fun168A的结构研究,揭示了内切1,3-岩藻多糖酶对硫酸化岩藻多糖的识别机制


酶工程与糖工程
定期推送酶工程与糖工程科研进展及科普知识,欢迎大家关注!!咨询、交流、合作等事宜请加运营QQ 242812212
 最新文章