随着大模型的兴起,人工智能技术日新月异,逐渐影响到许多行业。它可以画图、可以写文案,还会码代码,甚至还能谱曲。而在生物医学领域,人工智能也正在掀起一场革命!今年的诺贝尔化学奖就颁给了用于预测蛋白质折叠的AlphaFold的发明者。可以预见,将来像这样的人工智能应用在生物领域会越来越多。
今天我们就来聊聊AI近期在生物医学领域的新成果。从设计DNA开关到心电图风险评估,AI正在为人类带来前所未有的希望和可能性。
定制化DNA“开关”,开启精准基因治疗新时代
就在几天前,MIT和哈佛大学联合团队在《自然》上发表了题为“Machine-guided design of cell-type-targeting cis-regulatory elements”的文章,文中提出了一个开创性的平台,该平台利用机器学习来设计合成顺式调控元件(CREs),这些元件本质上是定制化的“开关”,能够以前所未有的精确度控制基因表达。该技术有望通过实现特定细胞类型中高度靶向的基因激活,彻底改变基因治疗与生物技术领域。
该技术名为CODA(DNA活性计算优化),它成功攻克了基因治疗领域长期面临的一项重大挑战:即如何精确地将基因递送到目标细胞。现有的方法常因精确度不足而难以避免非预期的副作用。对此,CODA提出了一种创新的解决方案:通过生成一种仅在目标细胞中激活基因的合成顺式调控元件(CREs),从而显著降低了脱靶效应。
CODA的工作原理融合了多项关键创新技术:
首先,大规模并行报告基因分析(MPRAs)技术使研究人员能够同时测试不同细胞类型中数十万条CRE序列的活性,从而构建了一个庞大的序列-活性关系数据集。
其次,基于这一数据集,CODA利用深度学习模型(Malinois)进行训练。这一复杂的神经网络能够预测各种细胞类型中任意给定DNA序列的活性,有效地揭示了基因表达的“调控密码”。
Malinois的准确性非常高,预测结果与实际CRE活性之间呈现出强烈的相关性(皮尔逊相关系数r=0.88-0.89)。此外,该模型还能成功运用STARR-seq、DHS-seq和H3K27ac ChIP-seq等正交方法进行活性预测。
图1:CODA能够有效地设计出细胞类型特异性的 CRE,图片来源自[1]
再者,CODA采用多种算法(包括进化算法、概率算法和基于梯度的算法)来迭代生成并优化CRE序列。这些算法利用Malinois的预测结果,旨在优化序列以实现所需的细胞类型特异性。同时,CODA系统设计为对超参数选择具有鲁棒性,以确保结果的一致性。一个显著的特点是,它能够避免使用过于普遍的序列模体,从而增加了生成序列的多样性。
为了验证CODA的有效性,研究人员对生成的合成CREs进行了严格的体外和体内测试。通过MPRAs技术,他们在体外对CREs进行了测试;同时,还在小鼠和斑马鱼体内进行了验证,以确认其在相关组织中的功能性和细胞类型特异性。
研究结果表明,CODA设计的合成CREs在细胞类型特异性方面显著优于自然发生的序列,实现了靶标与非靶标活性之间的清晰分离。研究人员还发现,这些合成序列具有与目标细胞类型活性相关的独特模体特征,并有效地降低了非靶标活性。这表明机器学习模型不仅能够预测现有模式,还能积极设计新颖且高效能的CREs。
这项研究的意义在于,它为设计基因治疗和其他需要精确基因控制的生物技术应用提供了一种强大的新工具。通过创建定制化的CREs,为治疗遗传性疾病、开发新型诊断工具以及深化我们对基因调控机制的理解开辟了广阔的前景。此外,CODA平台的通用性也表明,它有可能被广泛应用于不同类型的细胞和生物体中。这种创建高度特异性CREs的能力,有望与现有的基因递送技术(如纳米粒子和病毒载体)相结合,共同推动更安全、更有效的疗法的发展。
CODA的出现代表了人工智能在生命科学领域最新的应用方向,而除了基因治疗,人工智能在医疗的其它领域也大显身手。
AI赋能的心电图,洞察生命密码
刚刚发表在《柳叶刀·数字健康》上的一篇论文介绍了一个名为人工智能-ECG风险评估平台(AIRE),其卓越的性能和广泛的适用性,将彻底改变心电图(ECG)的应用。
AIRE平台是科学家们基于深度学习和离散时间生存模型,在庞大的BIDMC数据集上精心打造而成。该数据集包含了来自189,539名患者的1,163,401份心电图数据,为AIRE的精准预测提供了坚实的基础。AIRE不仅能够预测患者的死亡风险,还能准确估算出死亡时间,这在以往的AI-ECG模型中是无法实现的。
为了验证AIRE的有效性,研究团队选取了来自美国、巴西和英国的五个不同跨国队列进行验证。结果显示,AIRE在预测全因死亡率、室性心律失常、动脉粥样硬化性心血管疾病以及心力衰竭等方面均表现出色,C指数(即一致性指数,concordance index,是评价模型预测能力的一种重要指标)均达到了较高水平。这一结果无疑为AIRE的临床应用提供了有力的证据。
图2:AIRE 输出患者特异性生存曲线。(A)是两例在随访期间死亡的患者;(B)是两例在随访期间存活的患者。红色虚线表示死亡日期,蓝色虚线表示 AIRE 预测的死亡日期;(C)显示了在研究期间多次接受心电图检查的两例患者。图片来源自[2]
除了精准的预测能力外,AIRE还具备强大的解释性和生物学合理性。通过全表型关联研究和全基因组关联研究,科学家们揭示了AIRE预测风险增加的潜在生物学机制,包括心脏结构和功能的变化,以及与心脏结构、生物衰老和代谢综合征相关的基因。这些发现不仅为AIRE的预测结果提供了科学依据,也为未来的临床研究和治疗提供了新的思路。
AIRE平台的出现,标志着心电图分析技术迈入了一个全新的阶段。它不再仅仅是一个简单的诊断工具,而是一个能够预测患者未来健康状况、指导临床决策的重要平台。随着技术的不断进步和临床应用的深入,AIRE有望成为未来心电图分析领域的中流砥柱,为患者的健康管理和疾病治疗带来前所未有的变革。
小结
人工智能正在开启生物医学领域的一场革命,它不仅让科学研究变得更加高效精准,还为疾病的预防、诊断和治疗带来了前所未有的可能性。通过智能分析基因数据与医学影像,AI帮助研究人员和医生更快速地发现疾病背后的秘密,确保每位患者都能获得及时且个性化的医疗方案。
在药物研发过程中,AI就像是一位聪明的科学家助手,能够迅速筛选出具有潜力的化合物,并预测其效果与安全性,大大加快了新药从实验室走向临床的步伐。这不仅意味着更多创新疗法将更快地惠及患者,也降低了研发成本,使得资源得以更有效地利用。
此外,在个性化医疗方面,AI通过对大量遗传信息、生活习惯等数据的深入分析,为每个人量身打造最适合自己的健康管理计划,真正实现了“一人一方”的理想状态。同时,AI还在生物标志物发现、精准医疗以及基因编辑技术等领域展现出巨大潜力,推动着整个生物医学领域的进步与发展。
总而言之,随着技术不断革新,人工智能将在生物医学研究中发挥越来越关键的作用,为我们揭开生命科学的新篇章。
参考文献:
1. Gosai, S.J., Castro, R.I., Fuentes, N. et al. Machine-guided design of cell-type-targeting cis-regulatory elements. Nature 634, 1211–1220 (2024). https://doi.org/10.1038/s41586-024-08070-z
2. Sau A, et al. Artificial intelligence-enabled electrocardiogram for mortality and cardiovascular risk estimation: a model development and validation study. Lancet Digit Health. 2024 Nov;6(11):e791-e802. doi: 10.1016/S2589-7500(24)00172-9.
撰文 | linwen
编辑 | lcc
部分文字来源于网络,本文仅用于分享,转载请注明出处。若有侵权,请联系微信:bioonSir删除或修改!
点击下方「阅读原文」,前往生物谷官网查询更多生物相关资讯~