遇见/摘要
生物催化是合成手性药物和精细化学品的有吸引力方法,但评估和提升生物催化剂对目标底物的对映选择性通常耗时耗资。虽然机器学习已用于揭示蛋白序列与对映选择性之间的关系,但底物适配空间的建立常被忽视。本文利用课题组先前收集的240条实验数据,采用“化学”和“几何”描述符,构建随机森林分类模型预测酰胺水解酶对新底物的对映选择性。进一步提出基于这些模型的启发式策略,所设计的最优突变体的E值较野生型酰胺水解酶提高53倍。
遇见/内容
在生物催化的各种反应功能中,对映选择性受到了极大的关注。对蛋白质针对目标底物的对映选择性的预测,将大大加速生物催化反应系统的建立。尽管已经开发了多种计算方法来模拟生物催化反应,但由于微小的自由能差异超出了广泛使用的计算方法的有效精度范围,可能导致对映体过量值的大幅变化,因此预测生物催化的对映选择性通常会失败。进一步提高自由能计算的精度需要不可承受的计算费用。
近年来,机器学习作为生物催化性质预测和蛋白质工程的强大工具出现。机器学习预测器的成功在很大程度上取决于数据获取和特征提取。大量的蛋白质序列/结构信息和与生物催化相关的反应动力学参数可以从开放数据库中获得。然而,缺乏关于生物催化对映选择性的信息以及对映选择性数据测量的困难,严重阻碍了酶对映选择性的机器学习研究。尽管有少数机器学习预测器被报道用于建立反应对映选择性与酶序列/结构之间的关系,但通常忽略了底物的多样性对催化立体选择性的影响。
自上世纪90年代以来,我们所在研究团队(王梅祥/王德先课题组,前后有15名博士生参与这方面的研究工作)使用含有腈水合酶/酰胺水解酶的红球菌AJ270整细胞催化剂,系统地研究了多种外消旋或前手性底物的动力学拆分或去对称化反应。这种持续的探索为构建相应的机器学习模型提供了240个可靠且可比较的数据。我们将产物ee值换算成对映体反应过渡态能量差值,作为模型的标签值。
随后我们针对拟解决的对映选择性预测问题,采用了两种描述符:第一种是基于底物分子结构的“化学团”描述符,这类描述符通过分子结构中功能基团的“词汇”提取化学信息;第二种是基于原子中心对称函数(ACSFs)的“几何”描述符,主要关注底物的三维几何结构。前者提供了底物的化学基团信息,后者则反映了底物的空间构型信息。在此基础上,我们构建了四种分类模型:随机森林(RF)、支持向量机(SVM)、逻辑回归(LR)和梯度提升决策树(GBDT),并采用五折交叉验证评估其性能,其中RF模型的表现最好,被用于后续研究。为了全面评估底物的立体选择性,我们分别建立了分类标准为1.86, 2.40和3.00的三个分类模型(产物ee值80%, 90%, 95%分别对应分类标签值1.86, 2.40, 3.00)。
为了验证ML模型的预测能力,研究团队选择了两个模型底物:外消旋2-羟基-2-苯乙酰胺(1a)和环戊烷-1,2-二羧酰胺(3)。模型预测1a的对映选择性较低,而3的对映选择性较高。实验结果证实了这一预测:1a的产物ee值分别为61%和52%,而3的产物ee值达到了97%(图1)。为了提高酶催化底物1a的立体选择性,我们开展了虚拟筛选实验,利用ML模型预测了一系列与1a结构相似的底物,发现底物苯环上的对位取代基对反应的对映选择性有显著影响(图2)。基于这一发现,研究团队通过分子对接分析(图3),探讨了底物对酰胺酶活性位点的影响,发现对映体的不同结合模式导致了对映选择性的差异。随后,基于对接结果,研究团队进行了酶的理性设计,通过构建I198H、I198F、W328F单突变体和I198F/W328F双突变体,实现了反应E值的大幅提高(图4)。
中国科学院化学研究所李子琳与北京师范大学裴书鑫共同作为论文第一作者,北师大陈紫滢在论文修改阶段负责机器学习方面的研究,化学所敖宇飞与北师大申林和陈雪波为论文共同通讯作者。本工作得到了科技部重点研发计划(2019YFA0709400)、中科院先导B科技专项(XDB0960302)和国家自然科学基金(21977098, 22193041,22120102005)的支持。特别感谢清华大学王梅祥老师在数据和选题方向上的指导和帮助!
招聘启事
中科院化学所敖宇飞团队诚招博士后2名,拟从事人工智能辅助的酶工程研究,热忱欢迎生物催化、合成生物学、生物信息学或计算化学方向的青年才俊加入团队!
课题组链接:
http://dxwang.iccas.ac.cn/aoyufei
遇见/致谢
感谢敖宇飞老师课题组对本号的支持,感谢该课题组提供本文稿件支持!
1. 中科院化学所敖宇飞/格赖夫斯瓦尔德大学Bornscheuer合作Angew|建立转氨酶催化性能预测模型并用于数据驱动的蛋白质工程
2. 中科院化学所敖宇飞组ACS Catal | 理性设计实现酰胺水解酶的对映选择性调控
3. Nat. Comm.|表面展示酶的工程菌群催化半纤维素高效转化高值产品和电能
4. 江南大学陈坚团队刘龙组ME|脂滴中重构后角鲨烯途径实现酿酒酵母高效合成7-脱氢胆固醇
本期参考文献:
https://www.nature.com/articles/s41467-024-53048-0
遇见生物合成
合成生物学/天然产物生物合成
姊妹号“生物合成文献速递”