Nature 子刊,化学语言模型自动设计多靶点配体

学术   2024-10-26 11:09   北京  

ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯



编辑 | KX

生成式深度学习模型已用于分子从头设计。化学语言模型(CLM)可用于自动设计具有所需属性的分子。

在此,德国的研究人员探讨了 CLM 在多药理学设计中生成多靶标配体中的应用。

研究人员利用 CLM 从小分子微调集中学习的能力,并成功地将模型偏向于设计与靶标对的已知配体相似的类药物分子。

经过合并微调后从 CLM 获得的设计预测对两种目标蛋白均有活性,并且在一个分子中包含两种靶标的配体的药效团元素。

对六个靶标对的十二种计算上有利的 CLM 设计的合成和测试表明,所有选定的设计都对至少一种靶标蛋白质具有高达两位数纳摩尔效力的调节作用,并确认七种化合物为设计的双配体。这些结果证实了 CLM 多靶标从头设计是药物发现创新的源泉。

相关研究以《Automated design of multi-target ligands by generative deep learning》为题,发表在《Nature Communications》上。

论文链接:https://www.nature.com/articles/s41467-024-52060-8

AI 加速药物研发

代谢综合征 (MetS) 和慢性炎症性等疾病都是由多种因素导致的,涉及多种信号系统或代谢途径的失调。虽然多因素疾病和多重病症的治疗方案严重依赖于药物组合(也称为多药治疗),设计多药理学,可以实现协同作用,改善治疗结果,并克服多药治疗。

然而,设计针对几种靶标蛋白质表现出强效活性的分子具有挑战性。机器学习越来越多地用于加速药物研发,也可能有助于设计多靶点药物的发。

图示:代谢综合征和 CLM 在多靶标从头设计中的应用。(来源:论文)

化学语言模型(CLM)是经过训练的深度学习模型,用于捕获分子的字符串表示(即 SMILES),可用于自动设计具有所需属性的分子。CLM 已成功用于具有预期生物活性的新化学实体的从头设计,并能够在化学空间中导航以获得量身定制的分子设计。

使用 CLM 的数据驱动从头设计方法是无规则的,因为 CLM 能够从训练分子中提取相关特征,例如生物活性。因此,CLM 还可以通过访问两种蛋白质配体共同的化学空间区域来完成多靶点设计的任务。

CLM 自动设计多靶点配体

在该研究中,研究人员系统地评估和优化了 CLM 的应用,来设计感兴趣的蛋白质对的双配体。

重点研究了在 MetS 相关疾病中具有已证实作用的六个靶标的组合:

(1) 血管紧张素 II 受体 1 型 (AT1),它在心血管系统中发挥关键信号传导作用;

(2) 法尼醇 X 受体 (FXR),一种重要的保肝转录因子和代谢调节剂;

(3) 游离脂肪酸受体 1 (FFAR1、GPR40),参与胰岛素和肠道激素分泌的控制;

(4) 过氧化物酶体增殖激活受体 δ (PPARδ),它是多种组织中脂质和葡萄糖代谢的主要调节剂;

(5) 甲状腺激素受体 β (THRβ),作为非酒精性脂肪肝疾病的靶标正在评估中;

(6) 可溶性环氧化物水解酶 (sEH),它与心血管和炎症疾病有关。

这些靶标涵盖了广泛的蛋白质家族,即 G 蛋白偶联受体 (AT1、FFAR1)、核受体 (FXR、PPARδ、THRβ) 和酶 (sEH),这些蛋白质的配体具有治疗相关性或已针对与 MetS 相关的疾病进行了临床评估。值得注意的是,一些已批准的药物选择性地靶向其中一种蛋白质,经常在联合治疗中一起使用,这凸显了设计双配体在 MetS 中的潜力。

图示:CLM 设计的双配体的特征。(来源:论文)

研究人员训练 CLM 生成六个靶标对的双配体,并合成了排名靠前的候选物进行前瞻性验证。所有十二种 CLM 设计的化合物都在至少一个预期靶标表现出生物活性,并成功获得了三个靶标对的七种双重调节剂。

这些结果强调了 CLM 在访问化学空间所需区域方面的价值,并证实了它们在多靶标配体的自动从头设计中的应用。

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

ScienceAI
机器之心旗下媒体,关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。
 最新文章