广州国家实验室廖矿标团队: 已上线! 全面服务有机合成的AI大模型

学术   科学   2025-01-14 12:55   英国  

文章简介

近年来,随着自然语言处理领域的快速发展,大型语言模型的应用逐步从通用语言处理拓展到垂直领域。

广州国家实验室联合标智未来开发了一款专注于有机化学领域的智能化平台—SynAsk。这一成果以 “SynAsk: unleashing the power of large language models in organic synthesis” (《SynAsk:大语言模型赋能有机合成》) 为题,发表在英国皇家化学会期刊 Chemical Science 上,并被选为封面文章

SynAsk 的开发通过微调、知识库整合与智能体协同三步策略实现了对化学任务的精准适配。在模型层面,研究团队通过两轮精细调优,使其具备化学领域的专业知识和复杂任务的解决能力;在工具层面,SynAsk 集成了一个动态更新的化学知识库,并通过思维链条连接内部和外部工具,与用户交互实时解决问题;在执行层面,智能体的协作使其能够分解问题、调用工具并生成最终答案,打造了从输入到解答的完整闭环。

作为一款面向化学研究的智能助手,SynAsk 涵盖了分子信息检索、化学知识问答、化学文献获取、反应类型预测、反应条件推荐等多项功能,同时也能够完成反应产率预测和逆合成路径规划等高阶 AI 化学任务。例如,其 SNAr 反应产率预测平均误差仅为 11.7%,对 ChEMBL 数据库中的 11,549 种分子测试中,成功规划了 55% 的逆合成路径,在一些药物合成路线的设计上提出了很多独到见解。此外,SynAsk 还配备了自研的反应条件推荐与反应产率预测工具,可针对特定反应类型快速推荐最优反应条件与预测对应产率,平台中的文献检索和分子分析功能也为科研人员提供了全方位的支持。

SynAsk 的应用为化学研究者提供了高效的智能化解决方案。通过其动态学习机制,SynAsk 的知识库可实时更新最新化学数据,使其始终保持与前沿研究同步。研究团队计划进一步扩展 SynAsk 的功能,覆盖更多化学领域,如无机化学、材料科学和催化,并探索其与自动化实验室的深度融合,为未来化学研究的智能化和自动化提供坚实基础。

SynAsk 的访问地址为:https://synask.aichemeco.com

论文信息

  • SynAsk: unleashing the power of large language models in organic synthesis
    Chonghuan Zhang, Qianghua Lin, Biwei Zhu, Haopeng Yang, Xiao Lian, Hao Deng, Jiajun Zheng and Kuangbiao Liao*廖矿标,广州国家实验室)
    Chem. Sci., 2025, 16, 43-56
    https://doi.org/10.1039/D4SC04757E

作者简介

张崇焕 博士后
广州国家实验室
本文第一作者,博士,现为广州国家实验室廖矿标课题组博士后,研究方向为人工智能化学、科学智能、化学反应信息学、化学反应优化等。张崇焕 2023 年于英国剑桥大学化学工程与生物技术系取得博士学位,师从英国皇家化学会院士 Alexei A. Lapkin 教授从事人工智能辅助化学反应优化相关研究。他目前从事研究内容有化学反应网络优化、AI 引导的有机反应产率预测和反应条件优化、AI 引导的逆合成路线分析、化学垂直领域大模型等,致力于使用无代码化的人工智能来加速有机化学领域的研发。他也曾任职于陶氏化学(澳大利亚)公司任工程师,负责数据驱动化工体系优化等工作。






林强华 博士后
广州国家实验室
本文共同第一作者,现为广州国家实验室廖矿标课题组博士后,研究方向为高通量化学,人工智能化学,有机光化学,计算化学,物理化学等。林强华 2022 年毕业于日本广岛大学,在安倍学教授课题组从事有机光化学和理论计算的工作。目前专注于高通量化学反应与自动化,大数据驱动的反应筛选,反应正向产率预测和条件推荐等。发表 SCI 收录刊物论文 4 篇。






朱必伟 工程师
广州市标智未来科学技术有限公司
本文共同第一作者,爱丁堡大学统计与数据科学硕士,广州市标智未来科学技术有限公司大模型项目负责人兼算法工程师,同时担任 AI 教培大模型基础课程导师,主要研究方向包括应用数学、应用统计学、数据分析、机器学习、深度学习及其在大模型理论与应用中的拓展。目前主要从事大模型相关理论与方法的研究与项目实施,重点包括大模型的设计、搭建与优化,数据处理,提示工程设计与优化以及相关算法开发。参与多个大模型相关研发项目,致力于推动大模型技术在有机化学和教育领域的创新应用。






廖矿标 研究员
广州国家实验室
本文通讯作者广州国家实验室研究员,博士生导师,国家高层次青年人才,广东青年五四奖章获得者。课题组长期致力于利用自动化、高通量、人工智能等现代化学技术,开发新型合成方法学,建立人工智能反应预测模型,聚焦呼吸系统疾病开展新药研发。研究兴趣为 AI 化学。长期致力于设计建造新一代自动化高通量合成平台、建设化学反应大数据系统、发展人工智能反应预测模型以及开发新型有机合成方法学。至今,已以通讯作者或第一作者在 Nature(2篇)、Nature Chemistry、Chem、Angew Chem、Sci China Chem、ACS Catalysis 等期刊发表系列论文。

期刊介绍

Home to exceptional research and thought-provoking ideas. Open and free, for authors and readers.

rsc.li/chemical-science

Chem. Sci.

2-年影响因子*7.6
5-年影响因子*8.0
JCR 分区*Q1 化学-综合
CiteScore 分14.4
中位一审周期33 


Chemical Science 是涵盖化学科学各领域的跨学科综合性期刊,也是英国皇家化学会的旗舰期刊。所发表的论文不仅要在相应的领域内具有重大意义,而且还应能引起化学科学其它领域的读者的广泛兴趣。所发表的论文应包含重大进展、概念上的创新与进步或者是对领域发展的真知灼见。发文范围包括但不限于有机化学、无机化学、物理化学、材料科学、纳米科学、催化、化学生物学、分析化学、超分子化学、理论化学、计算化学、绿色化学、能源与环境化学等。作为一本钻石开放获取的期刊,读者可以免费获取所发表论文的全文,同时从该刊的论文版面费由英国皇家化学会承担,论文作者无需付费。

Editor-in-Chief

  • Andrew Cooper
    🇬🇧 利物浦大学

Associate editors
  • Vincent Artero
    🇫🇷 格勒诺布尔阿尔卑斯大学/法国原子能和替代能源委员会

  • Luis M. Campos
    🇺🇸 哥伦比亚大学

  • Lin Chen
    🇺🇸 西北大学

  • Graeme Day
    🇬🇧 南安普敦大学

  • Mircea Dincă
    🇺🇸 麻省理工学院

  • François Gabbaï
    🇺🇸 得克萨斯农工大学

  • Subi George
    🇮🇳 贾瓦哈拉尔·尼赫鲁高级科学研究中心

  • Ryan Gilmour
    🇩🇪 明斯特大学

  • Stephen Goldup
    🇬🇧 伯明翰大学

  • Jinlong Gong (巩金龙)
    🇨🇳 天津大学

  • Zaiping Guo (郭再萍)
    🇦🇺 阿德莱德大学

  • Christian Hackenberger
    🇩🇪 德国莱布尼茨分子药理学研究所

  • Malika Jeffries-EL
    🇺🇸 波士顿大学

  • Ning Jiao (焦宁)
    🇨🇳 北京大学

  • Tanja Junkers
    🇦🇺 莫纳什大学

  • Hemamala Karunadasa
    🇺🇸 斯坦福大学

  • Maja Köhn
    🇩🇪 弗莱堡大学

  • Yi-Tao Long (龙亿涛)
    🇨🇳 南京大学

  • James K McCusker
    🇺🇸 密歇根州立大学

  • Thomas J Meade
    🇺🇸 西北大学

  • Paolo Melchiorre
    🇮🇹 博洛尼亚大学

  • Gabriel Merino
    🇲🇽 墨西哥国家理工学院科研和高级研究中心

  • Hannah Shafaat
    🇺🇸 加州大学洛杉矶分校

  • Dmitri Talapin
    🇺🇸 芝加哥大学

  • Toshiharu Teranishi
    🇯🇵 京都大学

  • Andrei Yudin
    🇨🇦 多伦多大学

* 2023 Journal Citation Reports (Clarivate, 2024)

 CiteScore 2023 by Elsevier

 中位数,仅统计进入同行评审阶段的稿件








欢迎联系我们发布论文报道
📧 RSCChina@rsc.org

点击下方「阅读原文」查看

↓↓↓

RSC英国皇家化学会
英国皇家化学会,是全球领先的化学学术团体,致力于推动化学科学的卓越发展。推送最新的国际化学新闻,分享顶尖的化学科研成果及丰富的化学学术活动。
 最新文章