Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发

学术 2024-09-25 11:45 北京

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

编辑 | 萝卜皮

变构药物为现代药物设计提供了一条新途径。然而，识别隐蔽的变构位点是一项艰巨的挑战。

四川大学蒲雪梅教授、邵振华研究员团队提出了一种先进的计算流程，结合残基驱动的混合机器学习模型（RHML）和分子动力学（MD）模拟，成功识别出了变构位点、变构调节剂，并揭示了它们的调控机制。

具体而言，在 β2 肾上腺素能受体（β2AR）中，团队发现了位于残基 D79^2.50、F282^6.44、N318^7.45和S319^7.46 附近的一个新的变构位点及潜在调节剂 ZINC5042。通过分子力学/广义 Born 表面积（MM/GBSA）和蛋白质结构网络（PSN）的分析，进一步揭示了变构效力及调控机制。

该研究以「Integrative residue-intuitive machine learning and MD Approach to Unveil Allosteric Site and Mechanism for β2AR」为题，于 2024 年 9 月 16 日发布在《Nature Communications》。

变构作用是一种关键的生物调控机制，涉及远程位点的结构和动态变化，广泛存在于各种生物过程中。变构药物通过非竞争性结合调节蛋白活性，具有更高的选择性和更低的毒性，已用于治疗癌症、神经精神疾病和免疫疾病。

虽然 MD 模拟可帮助识别隐匿的变构位点，但其数据量大，难以手动分析，并可能受人为偏见影响。为此，结合机器学习可提高识别变构位点的效率，并为药物开发提供新方法，尤其是针对 GPCR 类药物，如 β2AR 的变构位点识别，具有重要意义。然而，现有方法仍存在局限性，需要进一步发展无偏通用的识别方法。

在最新的研究中，四川大学蒲雪梅、邵振华团队结合无监督聚类和可解释的深度学习多分类模型，探索了一种残差直观混合机器学习（称为 RHML）框架。

通过该框架，研究人员可以解决类别标签缺失的问题，实现具有残基级可解释性的准确分类，从而识别涉及变构位点的重要残基。

图示：框架概述。（来源：论文）

具体来说，首先进行广泛的高斯加速分子动力学 (GaMD) 模拟以增强采样，从而构建足够的构象空间。利用构象空间，构建了一个残基直观混合机器学习（RHML）框架，该框架由无监督聚类和基于可解释卷积神经网络（CNN）的多分类器组成。

使用 RHML，研究人员可以确定最佳簇数（标签）和变构位点打开时的构象状态。然后，通过 FTMap 结合 RHML 的 LIME 解释器识别变构位点。根据识别的变构位点，从两个化合物数据集中筛选出潜在的变构调节剂。

通过常规 MD（cMD）、结合能分析、结构分析和调控通路分析进一步探讨变构位点/药物的调控作用及其调控通路。

最后，通过 cAMP 积累试验、β-arrestin 募集试验和定点诱变实验进行实验验证。总的来说，这项工作涉及六个系统、15 μs GaMD 模拟和 22.5 μs cMD 模拟。

在确定假定的变构位点和筛选相关的调节剂之后，研究人员进一步探究它们与正构位点和活性区域等功能域的通信。

图示：可解释的基于 CNN 的多分类模型的架构。（来源：论文）

该团队的目标是进一步预先评估作为变构位点/调节剂的潜力并揭示它们的调控机制，这对于确保预测成功率和合理设计蛋白质的变构性至关重要，但在以前的变构药物设计方法中经常被忽视。

为了验证该识别策略的有效性，研究人员选取 G 蛋白偶联受体（GPCR）家族中的β2肾上腺素受体（β2AR）作为研究对象，发现了 β2AR 的一个变构位点和一个负变构调节剂（ZINC5042），并通过细胞功能实验对其进行了验证。

图示：变构位点和药物筛选策略。（来源：论文）

得益于技术优势，RHML 揭示了 β2AR 和其他 GPCR 中以前未报道过的变构位点。额外的变构位点位于残基 D79^2.50、F282^6.44、N318^7.45 和 S319^7.46 周围，研究人员利用虚拟筛选发现了假定的变构调节剂 ZINC5042。

在大量 cMD 模拟、MM/GBSA 和 PSN 的帮助下，研究人员进一步探讨了变构位点/调节剂与正构位点/激动剂之间的通讯，这对于进一步估计变构潜力以提高变构位点/药物识别的成功率具有重要意义。

MM/GBSA 显示 ZINC5042 以负协同方式减弱正位激动剂与 β2AR 的结合。结构分析表明 ZINC5042 阻碍了钠离子结合口袋的坍塌和PIF基序向活性态的构象转变，从而驱动受体构象向非活性态转变。

PSN 表明变构调节剂 ZINC5042 结合会降低螺旋结构间的通讯，从而不利于激动剂刺激的激活信号传导。此外，还鉴定了一些重要的变构调节残基。

基于充分的计算证据，基于 Glosensor 的 cAMP 测定和定点诱变实验强有力地验证了对变构位点和负变构效应的计算预测，清楚地证实了所鉴定的关键残基 D79^2.50，F282^6.44，N318^7.45 和 S319^7.46 确实在结合变构调节剂和抑制正构激动剂诱导的活化信号传导中发挥重要作用，特别是对于 F282^6.44。

图示：ZINC5042 的效力和变构位点的实验验证。（来源：论文）

总体而言，该识别流程解决了现有 ML 模型在 MD 构象分析中的局限性，包括最佳类别数、构象表示中的信息丢失和基于残基的预测结果解释。因此，RHML 能够对任何 MD 轨迹进行准确的构象分类和识别决定不同构象类别的重要残基。

该团队还上传了一个用户友好的残基直观混合机器学习框架代码。该代码提供可自定义的输入选项，自动生成可读的输出文件，其中包括簇类别和决定分类的重要残基。

图示：RHML 获取。（来源：网页）

研究人员期望它将成为 MD 领域的一种有价值的工具，用于辅助变构位点识别和与构象分析相关的其他 MD 任务。

框架代码：https://github.com/chyannn06/RHML

论文链接：https://www.nature.com/articles/s41467-024-52399-y

人工智能 × [ 生物神经科学数学物理化学材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。

欢迎关注标星，并点击右下角点赞和在看。

点击阅读原文，加入专业从业者社区，以获得更多交流合作机会及服务。

http://mp.weixin.qq.com/s?__biz=MzI3MjM3ODk0NQ==&mid=2247502955&idx=1&sn=8f0a853602a891e0e183ccc6c3da4244

ScienceAI

机器之心旗下媒体，关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。

最新文章

普林斯顿王梦迪团队提出蛋白水印方法，助力AI蛋白生成的版权保护与安全

贝佐斯、OpenAI领投，给机器人装AI「大脑」的Physical Intelligence获4亿美元融资

精准预测RNA可变剪接，浙大多模态深度学习模型SpTransformer登Nature子刊

创新能力超越AI Scientist，上海AI Lab「AI 科研团队」VirSci来了

类GPT化学语言模型，9秒生成100种化合物，微软AI药物设计平台登Nature子刊

登Nature，AI设计DNA开关，MIT团队实现精确的细胞控制

分类准确率达99%，山大团队提出基于对比学习的基因数据分类方法

准确、高效、物理有效，中科大、北大提出「两段式」分子对接统一框架DeltaDock

丹麦首台AI超级计算机，NVIDIA技术加持，服务于量子计算、清洁能源、生物技术等领域

TMI2024 | 阿大、同济等提出TraCoCo，用于3D医学图像半监督分割

科学实验室走向全自动化，机器人融合AI，加速科学发现，Science子刊观点

不懂AI、不会编码？如何轻松拿捏AlphaFold准确预测蛋白结构

Nature 子刊，化学语言模型自动设计多靶点配体

AI 驱动化学空间探索，大语言模型精准导航，直达目标分子

AI搞科研？西湖大学发布「AI科学家」Nova，效果比SOTA竞品提升2.5倍

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

1.1亿个结构DFT计算，Meta推出OMat24，AI驱动材料发现开源化

Nature子刊，北大陈语谦团队提出多模态单细胞数据整合和插补的深度学习方法

速度提高1000万倍，AI快速准确预测等离子体加热，助力核聚变研究

从结构准确预测蛋白质功能，东北大学「CNN+GCN」统一框架，优于现有方法

仅8B参数，可与GPT-4媲美，上交大团队构建多语言医学大模型

准确预测蛋白质功能，中山大学基于几何图学习的酶工程新方法

几秒完成化学反应，每天筛选上万反应，浙大、之江全自动高通量AI「机器人」

中国科学院核聚变最新进展，AI 加速等离子体参数预测

Nature子刊，香港浸大、英伟达团队多模态深度语言模型，用于复杂的宏基因组研究

AI 驱动的「科学搜索引擎」如何加速你的课题进度

水和算法有何相似？用物理学来理解大语言模型

化学空间导航仪：流生成式AI引导分子属性控制

AI发现超16万种新RNA病毒？阿里云、中山大学合作研究登Cell

化学诺奖为何颁给「AI+生物」，凭什么Baker独占一半？

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

Nature子刊，基于量子实验数据进行机器学习，用于解决量子多体问题

AI再夺诺奖！2024诺贝尔化学奖授予蛋白质计算领域三位科学家

诺奖颁给交叉学科，对「AI for Science」意味着什么？

从预测风暴到设计分子，微软的 AI 基础模型如何加速科学发现

精准预测流产风险，上海交大等开发可解释AI算法，为早期预防带来希望

中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式

如何用生成式 AI 定义我们的未来？看看微软怎么说

更简单、更清晰，解析核酸、蛋白、细胞等结构，AI实现快速分子模式挖掘

Science 发文，高通量蛋白质组学和人工智能的革命

中国科大、科大讯飞团队开发ChemEval：化学大模型多层次多维度能力评估的新基准

灵巧的机器人，DeepMind推出两个基于AI的机器手系统和未知场景「生成式AI」应对策略

同时生成蛋白序列和结构，David Baker团队序列空间扩散新模型登Nature子刊

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

OpenAI o1 在医学领域的初步研究，我们离 AI 医生更近了吗？

机器学习辅助催化剂设计，天大团队开发通用且可解释的描述符

中国科学院物理学家利用机器学习揭示原子核壳演化

Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发

23亿参数，Transformer架构，NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉