张康/李校堃/杨胜勇团队等最新权威综述!AI为药物研发全链条赋能

学术   2025-01-21 00:02   辽宁  

摘要:

药物开发历来是一项复杂且耗时的任务,传统上依赖开发者的经验和反复试验。然而,人工智能(AI)的崛起,特别是大型语言模型和生成式AI的应用,正在重新定义这一行业格局。将AI技术融入药物开发流程,已经在提升效率与效果方面取得了显著进展。

近日,温州医科大学附属眼视光医院、中国眼谷张康教授团队、温州医科大学药学院李校堃院士团队、四川大学杨胜勇教授团队,联合澳门科技大学、中山大学、广州实验室、北京生命科学研究所及斯坦福大学的研究人员,在国际顶尖期刊《Nature Medicine》(2024年影响因子/JCR分区:58.7/Q1)上发表了题为《Artificial Intelligence in Drug Development》的综述文章。该文全面回顾了AI在药物研发全流程中的应用进展,从疾病靶点识别、药物发现、新药设计、合成规划、临床前研究到临床研究及上市后监测,系统阐述了AI赋能药物开发的最新成果,并深入探讨了未来研究方向。

Nature Medicine综述代表最高级别医学评述文章,由杂志特邀世界顶尖行业权威撰稿,以引领行业前进方向、预测发展趋势和制定指南为目标。


一、AI技术为药物研发带来新机遇,破解行业痛点

药物研发历来面临着高风险、高投入及低效率等诸多挑战。研发流程涵盖多个阶段,包括生物标记物和靶点识别、药物发现、临床试验、监管审批及上市后监测。整个过程不仅耗资巨大(约26亿美元),周期长达12至15年,且成功率不足10%。疾病的复杂性、研发多阶段的特性、庞大的化学空间探索及严格的监管要求,均是导致这一低成功率的原因。

AI技术的飞速发展,特别是在图像识别、自然语言处理(NLP)和计算机视觉领域的突破,为药物研发中的难题提供了全新的解决方案。目前,AI已经在分析复杂生物系统、识别疾病生物标志物和潜在靶点、模拟药物与靶点的相互作用、预测候选药物的安全性与有效性,以及临床试验管理等多个环节中展现出巨大的应用价值(见图1)。

图1. AI在药物研发过程中的应用概览。药物开发流程包括多个关键阶段,如靶点识别、药物发现、临床前研究、临床试验、监管机构审查以及上市后监测。AI技术几乎在所有这些阶段都具有潜在的应用价值。CMC指化学制造与控制;DMPK 指药物代谢与药代动力学。


二、AI驱动的药物发现

AI正在改变传统药物研发流程,通过提高效率、降低成本、缩短研发周期,应用于以下几个关键领域:

(1)靶点识别(Target identification)

精准识别药物靶点是药物研发的关键环节。AI通过分析多组学数据和生物网络,发现与疾病相关的分子模式,帮助提升靶点发现的灵敏度。自然语言处理和图深度学习技术使AI能更高效地识别潜在靶点,尽管数据整合和模型可解释性仍是挑战,但AI在复杂数据中发现新靶点的潜力巨大。

(2)虚拟筛选(Virtual screening)

虚拟筛选是识别潜在药物候选化合物的重要步骤。AI加速了这一过程,特别是在筛选庞大的化合物库时。通过预测配体的空间变换、生成原子坐标并学习受体-配体结合的概率分布,AI提高了筛选的速度和准确性,显著缩短了发现潜在药物的时间。

(3)从头设计(De novo design)

AI在药物设计中通过生成新的分子结构并优化其药理性质,极大地缩短了设计周期(图2)。AI可以模拟不同化合物的结构和活性,帮助开发更具疗效和更低副作用的新药,从而减少实验验证和临床前研究的需求。

图2. 在药物研发中AI驱动的分子生成管线。分子表示形式——一维(1D)、二维(2D)和三维(3D)结构——来源于多种化合物、靶点和药物-靶点相互作用数据库,用于训练AI模型。这些模型包括生成对抗网络(GAN,一种由生成器和判别器两个竞争网络组成的神经网络架构,共同工作以生成逼真的数据样本)、循环神经网络(RNN,用于处理序列数据)、变分自编码器(VAE,一种生成模型,能够学习将输入数据编码到潜在空间中,并将其解码以重建原始数据)、正则化流模型(通过一系列可逆变换将简单概率分布转换为更复杂分布的一类生成模型)以及扩散模型(通过模拟扩散过程生成数据的生成模型)。这些模型生成的新分子随后会被评估其化学有效性、合成可行性和类药性,从而最终实现新类药性化合物的识别。

(4)ADMET预测(ADMET)

AI能够通过分析候选药物的化学性质和生物反应,提前预测其可能的毒性。这有助于在早期阶段筛除高风险化合物,减少临床试验中的失败率,提升药物的安全性和成功率。

(5)合成规划和自动化合成(Synthesis planning and automating synthesis and drug discovery)

AI在临床试验中有助于优化试验设计、患者招募和数据分析(图3)。通过精准筛选合适的患者群体、预测试验进展及结果,AI提高了临床试验的效率,降低了成本,同时也加快了药物从实验室到市场的进程。

图3. 在药物研发中的AI驱动的合成规划和自动化。a. 合成规划,合成规划过程从逆合成分析开始,将目标分子分解为可商业获取或已知的构建模块,然后通过反应预测确定合成目标分子所需的化学反应和条件。b. 自动化合成,示意图展示了在自动化合成过程中,AI驱动的软件与实验执行和结果分析的无缝集成。


三、 AI在临床试验和真实世界实践中的应用  

AI通过分析患者数据(如基因信息、病史、生活方式)优化临床试验,识别影响药物反应的生物标志物和患者特征,设计高效试验方案。通过优化患者选择和结果测量,AI提高试验成功率,加速药物转化;结合真实世界数据,AI可预测不良事件及药物相互作用。

(1)生物标志物发现(Biomarker discovery)

生物标志物在医学和药物研发中至关重要,但传统发现方法效率低、难以应对疾病复杂性。AI技术通过深度学习模型、图神经网络等方法,大幅提升生物标志物发现的效率。AI不仅能识别诊断、预后及预测性标志物,还可整合多模态数据(如蛋白相互作用和影像数据),提高标志物发现的精准性,从而加速精准医学发展和新药研发。

(2)预测药物计量学属性(Predicting pharmacometrics properties)

AI擅长处理高维数据和复杂非线性关系,通过多组学数据整合及模型分析,优化剂量反应关系、提升药物安全性并拓展治疗窗口。此外,AI能够提取药代动力学信息,帮助识别不良反应与药物相互作用,为个性化剂量调整和精准医疗提供有力支持。

(3)药物再利用(Drug repurposing)

AI分析大规模生物医学数据,挖掘药物潜在的治疗特性,为疾病提供全新治疗选择。通过高内涵筛选,AI验证了多种药物的作用机制,并分类到不同治疗类别,开辟药物再利用新方向。此外,基于人工智能的高内涵筛选(high content screening)也可以应用于药物再利用(图4)。

图4. 使用高内涵筛选(high content screening)和多组学数据(multiomics data)进行AI驱动的作用机制预测。a. 高内涵筛选,在高内涵筛选中,细胞被培养在多孔板中,并分别处理具有已知作用机制(MOA)或信号通路的多种药物(上图),同时在不同孔中引入全基因组范围的基因表达干扰(下图)。b. 数据整合与模型训练,在每个孔中,多组学特征、标记染色模式及细胞形态特征随时间的变化数据与相应药物作用机制或基因信号通路变化的知识相结合,用于训练AI模型,以理解每种药物对细胞网络的影响。c. 预测能力,由此,该AI模型能够预测具有类似多组学和细胞形态特征的新化合物的作用机制(MOA)。

(4)提高试验效率和预测结果(Improving trial efficiency and predicting outcomes)

临床试验通常成本高昂、耗时长且效率低下,大多数临床试验面临注册延迟或难以找到足够的志愿者。AI优化临床试验设计、招募流程和患者反应预测,提高试验成功率并降低时间和成本。借助多模态数据整合和深度强化学习,AI预测试验结果、评估不良反应和路径激活,助力真实世界研究中药物的有效性和安全性评估。在真实世界研究中,AI可以分析电子健康记录、保险索赔和可穿戴设备的数据,评估药物的有效性和安全性(图5)。

图5. 利用AI可增强临床试验进程和真实世界的医疗实践。a. 训练过程,训练过程中,利用多种临床和试验数据(包括电子健康记录、可穿戴设备数据、基因组学和影像数据),通过多模态嵌入和生成式AI开发AI-LLM(大型语言模型)。该模型用于评估药物疗效、优化试验方案,并支持智能化的临床前和临床研究。b. 验证与预测过程,通过真实世界数据和临床试验数据对AI-LLM进行验证,并结合治疗结果和不良事件进行微调。模型能够预测药物疗效、评估方案可行性并优化试验流程,从而支持智能化临床前和临床研究,加速药物开发进程。


四、 挑战与未来方向

尽管AI技术在药物开发中取得了显著进展,但仍面临数据不足、模型透明度低、计算成本高等问题,导致尚无AI开发的药物进入III期临床试验。未来研究可通过加强数据共享、开发稀疏AI方法和多模态预训练模型、结合多组学数据以及融入物理定律来提升预测精度和算法透明性。此外,与云服务商合作开发高效算法、优化临床试验设计、支持精准治疗决策,将进一步加速药物研发进程,造福人类健康。

眼界
聚焦中国眼科重要新闻,传播中国眼科界正能量。截止2024年9月,全国眼科专家、医生、行业高管等关注已超13万人,涵盖近90%中国眼科医生,年新闻阅读量近300万人次。兼任中华医学会眼科学分会特约通讯员、中国医师协会眼科医师分会工作秘书等。
 最新文章