江南大学倪晔/许国超组Nat Comm｜机器学习增强羧酯酶的立体选择性发散进化

文摘 2024-10-22 15:22 浙江

遇见/摘要

羧酯酶是手性羧酸和酯类对映体选择性合成的有效生物催化剂。对于近对称酯类化合物，天然的羧酯酶对映选择性表现较差。虽然机器学习能有效加快定向进化，但由于缺乏预测羧酯酶对映体选择性的模型，阻碍了研究的进展，主要难点是高质量的训练数据集的获得。在本研究中，利用高通量筛选获的高质量的数据集，训练出梯度提升的回归树模型，以促进立体选择性进化，获得了立体选择性互补的突变体。

遇见/内容

酶在合成生物学和生物催化领域引起了相当大的关注，被广泛誉为光学活性化学品生物合成的首选。酶在活性中心内立体化学结构通常表现为独特的空间、疏水和静电特性，构成了高立体选择性的基础。然而，在对于具有几乎对称结构的底物时，酶在保持高立体选择性方面面临挑战。手性环己-3-烯-1-羧酸（CHCA）具有一个几乎对称的六原子环，是合成各种药物、农用化学品和天然产物的关键组成部分。这些底物通常被认为是“难以区分”的，被化学催化剂和生物催化剂都难以识别。定向进化在加速立体选择性酶的开发中起着关键作用，在催化“难以区分”的底物时，也面临一定的挑战。

机器学习（ML）作为一种强大的计算工具，它为基于大量高质量数据和统计模型促进定向进化提供了更直接的捷径。ML是数据驱动的，可以识别催化模式，预测有用的突变体，并擅长预测定向进化的新替代组合。ML预测的成功取决于训练数据集的质量，生成高质量的数据集和选择合适的描述符是ML预测成功的关键。

在这项研究中，首先，我们提出了一种高通量方法来生成羧酸酯酶AcEst1的高质量数据集。通过将水解反应与醇脱氢酶（ADH）催化的氧化反应偶联来确定对(R)-和(S)-CHCE的初始反应速率，(R)-和(S)-CHCE之间的初始反应速率之比，称为表观对映选择性（E_app)。这种方法依赖于“真实底物”并准确反映了实际的反应动力学。我们对醇脱氢酶进行筛选并对ADH10进行了催化活性的改造，得到催化活性显著提高和亲和力提升的双突变体ADH10_V84L/F197V，并对催化剂量、辅酶、pH和底物浓度等进行优化，获得最佳的高通量筛选条件。

随后，为了收集关于AcEst1突变体对映选择性的多样化和高质量数据集以构建ML预测因子，确定了位于催化S201周围20个非保守残基用于饱和突变。在删除失活突变体的数据后，在1920个突变体中获得760个高质量数据集，利用羧酯酶的生化特征包括体积、疏水性、亲水性、静电、氢键、π-π相互作用和到催化残基的距离用于训练ML模型。我们评估了包括核岭回归（KRR）、高斯过程回归（GPR）、梯度提升回归树（GBRT）、随机森林回归（RFR）、支持向量回归（SVR）和贝叶斯岭回归（BRR）6个回归模型在AcEst1的对映选择性与7个生化特征之间的相关性。根据回归结果，GBRT的表现优于GPR、KRR、RFR、SVR和BRR。决定系数（R²）GBRT模型的值达到0.93，均方误差（MSE）为0.12。景观分析显示数据分布平滑，表明GBRT性能优异。KRR、SVR和BRR对E_app的预测无效，表现出较低的R²值（低于0.55）。RFR显示出比GPR更好的性能，具有更高的R²和较低的MSE。然而，RFR预测E_app升高突变体的能力不如GBRT和GPR稳定。在我们的模型中高质量的数据集和生化特征的结合获得更高的R²，尝试减少特征数量并重新训练GBRT模型导致相关性降低，证明了这七个特征的协同效应。

为了提高经过训练的GBRT预测模型的准确性，我们系统地组合了有利的单突变体来生成双突变体。E_app增加或降低的所有单个突变体配对，获得各种双突变体。V257M/Y228M的E_app值最高(13.8)，而L297F/L249A的E_app最低(0.36)。这些双突变体的加入进一步丰富了用于重新训练GBRT模型的数据集。然后使用单突变体和双突变体对GBRT预测因子进行重新训练。重新训练的GBRT预测因子表现出出色的性能（R²为0.97，MSE为0.11），应用于下一步指导AcEst1立体发散进化的组合突变（图1）。

图1 高质量的位点特异性饱和突变结果和预测AcEst1的E_app机器学习模型的开发

将经过训练的ML预测模型应用于设计组合突变体。考虑到V257M和L297F是E_app最高和最低的单个突变体，它们被选为(R)-选择性和(S)-选择性AcEst1突变体立体发散进化的起点。因此，V257M和L297F分别被指定为DR1和DS1，并利用GBRT预测组合突变的E_app。对于(R)-选择性进化，为了验证GBRT预测结果的准确性，我们实验构建了DR1、DR2和DR3，通过实验确定它们的对映选择性值（E值）。E值从WT的7.3逐渐增加到DR1的40.1、DR2的59.1和DR3的103。同样构建了(S)-选择性的突变体DS1-6，DS6的E值为−11，显著低于WT。虽然DS6的对映选择性不如DR3高，但考虑到(R)-和(S)-S1近乎对称的结构，对AcEst1的选择性已经算是相当显著的变化。因此，使用我们训练的GBRT预测因子，已经实现了AcEst1向近乎对称酯的立体发散进化，从而产生了两个立体互补突变体(图2)。这些突变体进一步用于合成手性CHCA的两种对映异构体。

图2 ML 指导的AcEst1的(R)和(S)-选择性突变体的立体发散进化

最后我们对互补突变体的催化潜力进行评估，并在1 M底物浓度下实现(R)和(S)-CHCE的生产与分离。采用分子动力学(MD)模拟及QM/MM计算解释了羧酯酶及其突变体立体选择性控制的分子机制(图3)。

图3 使用QM/MM计算进行WT、DR3和DS6的互补对映选择性和自由能分析

江南大学博士研究生窦哲为论文第一作者，倪晔教授和许国超副教授为论文共同通讯作者。上述研究得到了国家重点研发计划(2019YFA0906401)、国家自然科学基金(22078127, 22378169)等项目的资助。

本文转载自：遇见生物合成

http://mp.weixin.qq.com/s?__biz=MzU4ODEwODY3NQ==&mid=2247490864&idx=1&sn=ff30a6fc0aa7f6e11e89b352ce140f28

蛋白质工程与生物催化

广阔的生物世界

Angew 高效生物催化剂和生物活性蛋白的结构预测和计算蛋白质设计格赖夫斯瓦尔德大学 Uwe Bornscheuer

Angew 水相中通过酯化/外消旋化实现的双酶动态动力学拆分仲醇华沙理工大学 Paweł Borowiecki

南京大学黄小强/厦门大学王斌举 Nature 通过协同可见光催化构筑三组分光生物催化体系

中科院天工所张玲玲组 Nat Comm 通过工程化甲酸脱氢酶进行生物电催化二氧化碳还原

Science 使用Evo从分子到基因组规模的序列建模和设计斯坦福大学 Brian L. Hie

四川大学王娜 ACS Catal 在稠环内酯合成中酶促动态动力学不对称转化对映选择性的逆转

河北工业大学姜艳军/刘运亭 ACS Catal 用于苄基C−H键对映选择性羟基化和氨基化的化学酶促级联反应

南京师范大学张幸丨南京大学袁帅 Angew 动态配体解锁MOF介孔实现大尺寸糖酶的封装

JACS 祖先序列重建以实现 Azaphilones 的生物催化合成密歇根大学 Alison R. H. Narayan

遵义医科大学陈永正 ACS Catal P450DA单加氧酶催化未活化烯烃的化学选择性和对映体发散性环氧化

江南大学倪晔/许国超组Nat Comm｜机器学习增强羧酯酶的立体选择性发散进化

Nat Commun| 浙江大学医学院王健博团队联合暨南大学张志民、周洋团队解析糖基转移酶化学选择性机制及打造糖基化平台的研究

ACS Catal 烯还原酶将α,β-二羰基不对称单还原为α-羟基羰基代尔夫特理工大学 Caroline E. Paul

华盛顿大学 Jesse Zalatan Angew 非血红素铁酶的计算稳定性可实现新功能的有效进化

普林斯顿大学 Todd K. Hyster Nature 在光酶中C-N键形成的独特机制的出现

2024年诺贝尔化学奖揭晓，三位科学家获奖

刚刚！诺贝尔生理学或医学奖出炉，他们让我们重新认识基因调控 | 深度解读

ACS Sustain Chem Eng 从5-羟甲基-2-糠醛化学酶法合成芳香族乙烯基单体比勒费尔德大学H. Gröger

东京大学Ikuro Abe组Angew综述｜天然产物生物合成途径中异戊烯基侧链的修饰反应

浙江工业大学柳志强 ACS Catal 高度立体选择性和高效的生物催化合成手性顺式芳基β-羟基α-氨基酯

南开大学陈瑶 Angew 快速生产共价有机框架用于共价酶固定化并通过太阳能驱动的光热效应增强酶催化

Greifswald大学Uwe Bornscheuer/韦韧团队Angew｜功能化低分子量聚乙烯的化学-酶法降解

加州理工学院 Frances H. Arnold JACS 通过氮烯C−H插入进行α-氨基酯的生物催化合成

江南大学夏雨/中国农科院邢福国Food Chemistry：染料脱色过氧化酶的磁性纳米材料固定化及其对两种真菌毒素的同时高效降解

中国药科大学李家璜/UCSD李婉璐 J Phys Chem B 去甲乌药碱合酶的酶隧道动力学及催化机制解析

曼彻斯特大学 Nicholas J. Turner ACS Catal 双功能亚胺还原酶级联合成饱和氮杂环化合物

北京大学来鲁华/张长胜团队 Angew 基于深度学习的全原子蛋白质序列设计

直播预告｜上海交大博士后周子宜详解蛋白质语言模型的小样本学习方法 FSFP

江南大学刘龙组 Nat Comm 从头设计的可编程和多功能生物分子凝聚体用于控制生物合成

ACS Catal 通过顺序和串联过程从烯烃选择性合成线性伯胺的化学酶促氨甲基化策略加州大学 John F Hartwig

天津工生所孙周通/袁波组 Angew 工程化亚胺还原酶催化轴手性化合物的合成

天津工业生物所在卤醇脱卤酶催化手性氧杂环丁烷合成方面取得新进展

江苏海洋大学高嵩/盐城师范学院王佩ACS Sustain Chem Eng内封面文章 McBans定向固定胞苷脱氨酶实现多轮催化

中科院天工所崔成森/微生物所王罗医 OL 工程亚胺还原酶催化烷基化苯丙胺的对映体合成

公众号一万关注啦！

江南大学龚劲松/陆震鸣 ACS Catal 关于祖先腈水解酶的挖掘、改造与机制解析

基于醛缩酶和苯丙氨酸裂解酶的化学-酶法合成含氟-L-α-氨基酸

范广益/章文蔚/李盛英/孙颖等Nature：揭示全球海洋微生物基因资源利用潜力，助力生物技术与生物医药发展

湖南农业大学夏菠 Bioresour Technol 增强不溶性甲壳素的降解：可持续应用的工程化高效融合几丁质酶

第七届绿色制药莫干山国际会议暨《中国医药工业杂志》学术年会预告

河北科技大学陈启佳 IJBM 结合立体互补的D-和L-乳酸脱氢酶的多酶级联一锅法不对称合成手性苯乳酸

ACS Catal 将杂环化酶整合到多酶级联中实现饱和氧杂环化合物的高选择性生物催化一锅合成拜罗伊特大学 Frank Hahn

北京大学深圳研究院项征 JACS 设计与进化含有有机硼酸基团的人造Friedel-Crafts烷基化酶

北京化工大学吕永琴组 PECS综述：MOFs基电催化剂在二氧化碳还原中的结构-性能关系研究进展

Chem Catal综述：光生物催化：不仅仅是一个有趣的实验室好奇心？Frank Hollmann/华南理工大学王永华

中科院天工所孙周通/曲戈 Chem Comm综述通过减少热点数量和文库规模进行理性酶设计

北京大学深研院高加力/杨世和 JACS Au 工程化氧气非依赖型NADH氧化酶并结合电催化FAD辅因子再生

中国科学院深圳先进院戴卓君 Nat Chem Bio “活”塑料：合成生物学助力塑料降解新解法

ACS Catal 将铁卟啉重新组装到肌红蛋白中生成具有扩展催化活性的人工醛肟脱水酶大阪大学 Takashi Hayashi

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉