Bringing medical advances from the lab to the clinic
关键词:人工智能;基因调控;合成DNA序列;靶向治疗;Nature在生物学领域,细胞基因组的不同部分可以根据细胞在体内的功能以及是否处于疾病状态而变得活跃或不活跃。基因激活或抑制的指令编码在基因组中,每种类型的细胞都有其基于核苷酸复杂模式的基因调控“语言”。
随着人工智能(AI)技术的发展,特别是机器学习算法的进步,科学家们开始利用这些技术来解析基因组中的复杂模式,并设计出能够精确调控特定细胞类型基因表达的合成DNA序列【1】。
2024年10月23日,Gosai 等研究学者在国际顶尖期刊 Nature 上发表了题为 AI-designed DNA sequences regulate cell-type-specific gene expression 的新闻综述 【2】。作者认为,通过AI设计的合成序列在驱动目标细胞的基因表达方面,比自然界中发现的任何调控元素都更具特异性。(如需原文,请加微信healsana获取,备注20241023Nature)
🔷 AI学习基因调控模式:
Gosai等人的研究中,通过应用人工智能(AI)方法,特别是卷积神经网络(CNNs),学习了基因组中与基因调控活性相关的核苷酸模式,即不同细胞类型特有的“调控语法”。
利用从大规模并行报告基因分析(MPRAs)获得的数据训练AI模型后,这些模型能够生成成千上万的合成调控元素序列。这些合成序列模仿了模型训练时的自然序列的细胞类型特异性。通过MPRAs,研究人员测试了合成序列对特定细胞类型的特异性。结果显示,这些合成序列在驱动目标细胞的基因表达方面比自然界中发现的任何调控元素都更具特异性。在小鼠大脑中的实验表明,一个受候选神经元特异性合成序列控制的报告基因(黄色)仅在神经元中表达,而不在小胶质细胞或星形胶质细胞中表达。这种细胞类型特异性的基因表达对于将基因治疗靶向特定细胞群体具有重要价值。研究结果表明,这些合成序列有潜力限制各种基因疗法的毒性,因为它们仅在特定的细胞群体中活跃,从而减少了非目标细胞的影响。这项研究是将AI和实验生物学紧密结合以加速生物学发现的一个更广泛趋势的一部分。这种整合不仅在基因调控序列设计中发挥作用,还在其他领域如CRISPR蛋白的创建中展现出潜力,这些蛋白相比于自然界中的蛋白具有更少的非目标效应。尽管取得了进展,但在将这项技术应用于临床之前,仍需要克服一些基本障碍,包括扩展对基因组序列功能测量的能力,并开发新的计算和实验技术以更好地模拟人类细胞和组织。上述研究结果标志着基因组学领域从描述生物学向工程生物学的转变,并为细胞和基因治疗提供了激动人心的应用前景。
图1. AI辅助设计的调控基因表达的序列
本研究通过人工智能辅助设计合成DNA序列,实现了对特定细胞类型的基因表达的精准调控,有望减少基因治疗中的非目标效应,提高治疗的安全性和有效性。此外,这项工作也启示科研人员,通过深度整合AI技术和实验生物学,可以加速生物学发现,并推动基因组学从描述性研究向工程性研究的转变,为开发新的治疗策略和药物提供了新的思路和工具。未来,跨学科的合作和新一代生物学家、计算生物学家以及生物医学工程师的培养将对进一步推动这一领域的发展起到关键作用。原文链接:
【1】https://doi.org/10.1038/d41586-024-03170-2
本文只是分享和解读公开的研究论文及其发现,以作科学文献记录和科研启发用;并不代表作者或本公众号的观点,更不代表本公众号认可研究结果或文章。为了给大家提供一个完整而客观的信息视角,我们有时会分享有冲突或不同的研究结果。请大家理解,随着对疾病的研究不断深入,新的证据有可能修改或推翻之前的结论。作者:Amber Wang;助理:ChatGPT;编辑:Jessica,微信号:Healsanq,加好友请注明理由。美国Healsan Consulting(恒祥咨询),专长于Healsan医学大数据分析(Healsan™)、及基于大数据的Hanson临床科研培训(HansonCR™)和医学编辑服务(MedEditing™)。主要为医生科学家、生物制药公司和医院科研处等提供分析和报告,成为诸多机构的“临床科研外挂”。点击👆;From Bench to Bedside, Healsan Paves the Path.(点击👆图片,进入自己感兴趣的专辑。或点击“资源”,浏览本公众号所有资源。)