哈佛重磅突破!AI确定17000多种疾病候选药物,罕见病“孤儿药”不再遥远?

学术   2024-10-21 09:09   北京  


“对于罕见病患者而言,有药可用永远都是第一位的。”


中国国际经济交流中心理事长毕井泉曾于 2022 年这样说。


罕见病,顾名思义,是患病相对较低的一类疾病。由于患病人数少、市场需求小,以及药物研发难度大、成本高、周期长,罕见病治疗难度居高不下,罕见病用药更被称为“孤儿药”。绝大多数罕见病患者都面临着治疗困难、药物短缺的问题。


据世界卫生组织(WHO)报道,在全球发现的超过 7000 种的罕见病中,有获批的相应治疗方案或药物的病种不到10%,且大多需要终身药物治疗。在这一严峻背景下,如何为罕见病寻求有效治疗药物是缓解罕见病患者治疗困境的关键一步。


这一步,在人工智能(AI)的帮助下有望向前迈出“一小步”。


日前,来自哈佛医学院的研究团队及其合作者开发了一个名为 TxGNN 的 AI 模型,这是首个专门为识别罕见疾病和无药可治病症的候选药物而开发的新办法,它从现有药物中确定了 17000 多种疾病的候选药物,其中许多疾病没有任何现有治疗方法。与用于药物再利用的同类 AI 模型相比,TxGNN 在识别候选药物方面平均提高了近 50%,在预测哪些药物会有禁忌症方面,准确率也高出 35%。


相关研究论文以“A foundation model for clinician-centered drug repurposing”为题,已发表在 Nature 子刊 Nature Medicine 上。




AI 如何促进药物再利用?


传统的药物再利用(drug repurposing)策略,虽然利用现有药物的安全性和有效性数据,可以加快新药物在临床中的应用,但这种方法往往是偶然的且机会性较强,很难系统地解决罕见病的药物研发问题。


在这种背景下,TxGNN 应运而生,为药物重新利用带来了革命性的突破,特别是在罕见病药物发现中展现出巨大的潜力。


TxGNN 是一种基于图神经网络(GNN)的基础模型,专门用于零样本药物再利用。与传统方法不同,TxGNN 并不局限于现有药物和疾病的已知关系,而是通过训练一个医学知识图谱(KG),将疾病和药物之间的复杂关系嵌入到一个潜在的表示空间中,从而能够针对任何给定的疾病预测潜在的治疗药物。该知识图谱包含了 17080 种疾病、7957 种药物、27671 种蛋白质等医学概念,为 TxGNN 的训练提供了丰富的数据基础。


图|TxGNN 是药物再利用的图基础模型,可为治疗选择有限且分子数据有限的疾病确定候选药物。(来源:该论文)


在多次实验中,TxGNN 展现出了其强大的预测能力。与 8 种现有的方法进行对比,TxGNN 在零样本环境下表现出了显著的优势。根据论文中的实验数据,TxGNN 在药物指征预测的准确率上提高了 19%,在副作用预测上提高了 23.9%。


这些结果表明,TxGNN 不仅能够在现有治疗方案中找到潜在的新用途,更能够在没有已知治疗方案的情况下,准确地预测出可能的药物。这对于罕见病的治疗具有重要意义,因为罕见病中超过 95% 没有现有的治疗药物,而 TxGNN 为这些疾病快速发现新药物创造了可能性。


图|TxGNN 可准确预测药物适应症和禁忌症。(来源:该论文)


除了预测能力,TxGNN 还特别设计了一个解释模块,用于帮助医生和研究人员理解模型的预测逻辑。这个模块通过多跳路径(multi-hop paths),展示了药物与疾病之间的潜在联系。


解释模块不仅能够指出某种药物为何对特定疾病可能有效,还能提供详细的医学知识路径,让使用者能够追溯到预测背后的科学依据。通过这项功能,TxGNN 克服了许多 AI 模型在医学应用中的“黑箱问题”,大大提高了模型的可解释性和信任度。


图|TxGNN Explainer 中多跳可解释路径的开发、可视化和评估。(来源:该论文)


研究团队对 TxGNN 在罕见病药物发现中的实际应用进行了验证,并取得了令人鼓舞的成果。在实验中,TxGNN 的许多预测与实际的临床非处方药物使用具有高度一致性。


例如,在对 1272085 名患者的电子病历数据分析中,研究人员发现,TxGNN 预测的顶级药物在这些患者群体中的使用频率显著高于随机预测。log(OR)(共现比值)的分析显示,TxGNN 预测出的药物与罕见病的使用关联性比底层药物预测高出 107%,进一步证明了该模型在实际临床环境中的有效性。


图|在大型医疗系统中评估 TxGNN 的预测结果。(来源:该论文)


一个具体的案例是,TxGNN 在预测 Wilson 病(一种导致铜代谢异常的罕见病)的潜在治疗药物时,推荐了去铁酮(Deferasirox)作为最有前途的候选药物。该药物在临床中已被用于治疗铁超载疾病,TxGNN 通过其解释模块展示了去铁酮可能通过代谢途径对 Wilson 病的治疗产生积极作用。这一预测也与医学文献中的相关研究结果相符,显示了该模型的科学合理性。


在当前药物开发周期漫长、成本高昂的背景下,TxGNN 为现有药物的重新利用提供了系统化的解决方案。


未来,随着这一技术的不断完善,它有望成为加速药物开发、特别是使罕见病患者“有药可用”的关键驱动力。



在医学领域,AI 大有可为


除罕见病领域,AI 在其他医学领域也有着广泛的应用。


2019 年 9 月,AI 药物研发公司 Insilico Medicine 开发了一个名为 GENTRL 的生成式 AI 平台,该平台已用于设计用于治疗纤维化和癌症等疾病的新药。通过使用 GENTRL,研究人员仅使用 21 天就发现了盘状蛋白结构域受体 1 (DDR1) 的强效抑制剂,极大缩短了药物发现时间。


2022 年,伦敦癌症研究所的研究人员创建了一个原型测试,可以在 24-48 小时内预测哪些药物组合可能对癌症患者有效。他们使用 AI 分析来自肿瘤样本的大规模数据,可以比目前的方法更准确地预测患者对药物的反应。


2023 年,美国公司 Nuance Communications 推出一款新型 AI 驱动的语音激活软件应用程序——Dragon Ambient Experience (DAX) Express。该计划旨在通过利用自然语言处理技术,促进患者咨询期间医疗记录的实时转录,有效帮助减轻临床医生的管理负担。


2024 年,来自哈佛医学院的研究团队及其合作者提出了临床组织病理学成像评估基础(CHIEF)模型,用于提取病理成像特征以进行系统的癌症评估。在包含 11 种癌症类型的 15 个数据集上,CHIEF 在癌症检测方面实现了近 94% 的准确率,显著优于之前的 AI 方法。


毋庸置疑,AI 在改善罕见疾病检测、药物再利用以及临床流程优化方面的潜力将会越来越大,能够更好地帮助我们更好抗击疾病。


作者:阮文韵
如需转载或投稿,请直接在公众号内留言

学术头条
致力于学术传播和科学普及,重点关注AI4Science/大模型等前沿科学进展。
 最新文章