ACS Catal 结合祖先序列重建与机器学习改善烯还原酶的热稳定性 辉瑞全球研发中心 Russell D. Lewis

文摘   2024-11-30 11:04   辽宁  

1
摘要
烯还原酶(EREDs)是一类催化 C=C 键不对称还原的酶。EREDs 在大规模合成药物化合物中具有潜在应用,但由于其在工艺条件下往往不稳定,因此其作为生物催化剂的应用受到限制。以往的研究通过祖先序列重建(ancestral sequence reconstruction,ASR)克服了这一限制,ASR 是一种基于同源序列预测进化祖先的生物信息学方法。本研究旨在应用 ASR 设计酶库,并结合机器学习预测最稳定的酶库突变体。通过 ASR 预测中不确定的位点生成了一个 ERED 酶库,并通过筛选部分库的实验数据构建了一个机器学习模型,能够准确预测具有提高热稳定性的变体。在模拟工艺条件下,最稳定的酶在一系列底物的反应中表现优于野生型和祖先亲本酶。预见通过 ASR 与机器学习的结合可以广泛应用于其他类型的酶,促进高质量工业生物催化剂的开发。

2
研究内容

图1. ERED 催化还原1a的反应图

图1. ER120 CLADE 点突变体的活性和热稳定性。(用于定向进化的祖先组合文库,Combinatorial Libraries of Ancestors for Directed Evolution,CLADE)(A) 为 ER120 每个位点氨基酸身份不确定性分布的代表性部分,选择了不确定性最高的位点进行突变。(B) 为 CLADE 位点表。(C) 显示了 CLADE 点突变体的酶活性。(D) CLADE 点突变体的热稳定性。

图2. CLADE 组合文库的表征。(A)酶活性分布。(B)热稳定性分布。

图3. 使用机器学习进行计算机筛选。(A) 应用于酶工程的机器学习工作流概述。筛选数据作为输入用于构建回归模型。通过留一法交叉验证(LOOCV)测试模型。表现最好的模型被用于预测所有可能序列的适应性。预测具有最佳特性的变体随后通过实验确认。(B) 热稳定性的线性支持向量回归(SVR)模型的 LOOCV。(C) 机器学习预测的突变体,从最高到最低的预测适应性排名。框中突出显示。(D) 预测最优突变体的突变率(ΔTm ≥ 3 °C)。

图4. ER218 和点突变体的热稳定性和活性。

表1. 热稳定化 EREDs 的底物适用性

图5. 在工艺相关条件下进行大规模 ERED 还原。(A) ERED 催化还原 4aS-4bR-4b 的反应方案。(B) 在不同时间点对使用 25 g/L (164 mM) 底物进行的反应进行取样。(C) 在不同反应条件下测量 24 小时内转化为 S-4b R-4b 的转化率。

在这项工作中,作者结合使用 ASR 和机器学习来指导工程工作,以实现可在工艺规模上应用的 EREDs。根据 ASR 预测中的不确定性生成酶组合库。从库中筛选数据用于生成可以准确预测热稳定性 ERED 的机器学习模型。稳定性的提高导致在工艺相关条件下对各种底物的酶活性提高。预计 ER218 将普遍用于小分子制造,本结果强调了热稳定性工程在工业生物催化中的重要性,预计可以作为稳定多种类型酶的通用策略。

3
论文相关信息

文章信息:Ancestral Sequence Reconstruction Meets Machine Learning: Ene Reductase Thermostabilization Yields Enzymes with Improved Reactivity Profiles

文章链接:https://doi.org/10.1021/acscatal.4c03738

谢谢支持,欢迎您用科研的小手点个赞
 左下角阅读原文

蛋白质工程与生物催化
广阔的生物世界
 最新文章