JACS Au|巫瑞波课题组开发化学-酶法融合的小分子逆合成导航工具BioNavi

学术   2024-07-07 10:11   日本  

遇见/摘要

高附加值化学品绿色高效合成路线的设计至关重要。生物合成和化学合成各有优势,AI驱动的合成路线规划工具已经有不少,但现有的合成路径设计工具大多只考虑单一合成方式,限制了小分子合成路线多样性的探索。

中山大学药学院巫瑞波教授课题组开发了一个基于深度学习的合成路线设计工具BioNavi。作者首先利用原子映射对反应数据进行清洗与预处理,从而提高数据质量,然后将有机反应和酶反应混合用于模型训练,并优选了训练权重使得模型对两类反应同时到达较高的预测精度。在逆合成预测的过程中使用SMILES表征分子,并且在反应物端增加特定的标识符(有机反应或酶反应)用于判断反应类别,即模型不仅能输出候选的反应物分子还能给出该反应最可能的反应类别。为了让模型具有更强的解释性,每一步预测的反应均用已有的反应模板进行验证,并综合Transformer的预测概率和反应模板的匹配度进行重新打分和排序。最后将上述单步逆合成模型与搜索算法Retro*相结合完成多步合成路线的预测。


数据处理与模型框架

遇见/内容

为了让BioNavi更好地服务于领域内研究人员,特别是非计算背景的用户,作者还在前期发展的天然产物生物逆合成导航平台(BioNavi-NP)的基础上进行了网站界面与交互逻辑的优化,搭建了更加友好便捷的在线计算平台(http://biopathnavi.qmclab.com/bionavi/)供学术界免费试用。该平台利用深度学习模型对现有反应知识进行学习,为路线中的每个中间体选择合适的化学或酶法合成步骤,既可以一次性给出完整的潜在路线预测,也支持用户通过自身经验和专家知识进行交互式地一步步推演、优化合成路线。


在线服务器界面


经过参数的优化,单步逆合成模型对有机反应(uspto-full)和酶反应的top-10预测准确率分别为71.6%和73.0%。为了验证BioNavi设计合成路线的能力,作者构建了天然产物(即酶反应合成路线为主)和热销药物分子(即有机反应合成路线为主)两个测试集对模型进行评估。结果表明BioNavi显著优于当前的生物逆合成算法,能够对测试集中97%的天然产物进行路线预测(预测成功率),并且准确率达75%。而针对药物分子,BioNavi的预测成功率也领先于其他有机逆合成算法。虽然BioNavi需要更长的计算时间,但在单个GPU上平均每个分子也仅需十分钟左右。此外,BioNavi取得较高预测准确率的同时,其输出的合成路线也更加多样,这不仅仅体现在BioNavi能够输出更多的结果,也体现在路线之间共有反应较少。作者还对BioNavi和当前另一化学酶法合成路线设计工具ASKCOS预测的合成路线进行了比较,结果显示无论是对天然产物还是合成药物,BioNavi能够都预测出更多的化学-酶法杂合的合成路线,凸显了BioNavi在化学酶法合成路线设计上的优势。



模型表现


随后作者以抗新冠药物nirmatrelvir和天然产物jomthonic acid A为例进行合成路线的预测,结果表明预测路线与实验报道的合成路线基本一致,仅有保护基团与少数步骤合成顺序上的差异,进一步证明了BioNavi在合成路线预测上的能力。最后作者对训练集中已有的丁香酸分子进行合成路线预测,预测排名靠前的合成路线仅需3至4步,而文献报道的合成路线长达数十步,因此并未出现在top-10中。随后作者与深圳先进技术研究院于涛研究员团队合作,首先基于反应规则匹配得到路线中所需的催化酶,然后在酵母中对预测的合成路线进行了构建。最终路线前两步得到验证,后续的甲基转移酶并未发挥作用,这还有待借助酶挖掘与改造等手段去构建完整的合成路线。该案例展示了BioNavi在合成路线重设计上的应用潜力,同时也表明酶挖掘与改造技术的融合是未来该方法改进的重要方向之一。


案例展示


中山大学药学院博士后曾涛为论文第一作者,巫瑞波教授为通讯作者,深圳技术研究院于涛研究员、博士后金哲浩和上海交通大学长聘教轨助理教授郑双佳也对本工作做出了重要贡献。该工作获得了广东省重点研发计划以及科技部重点研发计划的经费支持。

遇见/致谢

感谢中山大学药学院巫瑞波教授课题组对本号的支持,感谢该课题组提供本文稿件支持!
往期精选▼

1.  山大李盛英/湖北大学郭瑞庭/中山大学巫瑞波合作Nat Commu|细菌二萜合酶VenA的结构、催化机制与酶工程研究

2.  协和药物所訾佳辰组和中山大学巫瑞波组Nat Comm|檀香挥发油生物制备方法研究方面重要进展

3. 中山大学巫瑞波组JCIM论文 | 数据库驱动的萜类天然产物研发平台(TeroKit)

4. 中山大学巫瑞波组ACS Catal|环氧角鲨烯环化酶机制再探-量子-经典力学组合方法助力羊毛甾醇生物合成研究

5.  山大李盛英与西湖大学张彪彪合作Sci. Bull. | 通过光催化剂COF和P450过加氧酶级联催化合成1-烯烃和羟基脂肪酸

本期参考文献:

https://pubs.acs.org/doi/full/10.1021/jacsau.4c00228

遇见生物合成

合成生物学/天然产物生物合成

姊妹号“生物合成文献速递”

谢谢支持,我们需要您的一个“在看”

遇见生物合成
1)简述国内外合成生物学与天然产物生物合成相关研究进展,解读最新文献资讯;2)简述学术界那些事,偶尔情怀主义;3)化学与生物学的完美碰撞;4)高校与研究所那些事。
 最新文章