论文ID
题目:Machine-guided design of cell-type-targeting cis-regulatory elements
期刊:Nature
IF:69.504
发表时间:2024年8月21日
通讯作者单位:巴尔港杰克逊实验室
DOI:https://doi.org/10.1038/s41586-024-08070-z
主要内容:
细胞基因组的不同部分可以是活跃的或不活跃的,这取决于细胞在体内的功能,以及它是否处于疾病状态。激活或抑制基因的指令在基因组中编码,每种类型的细胞都有自己的基因组“语言”,该语言基于高度复杂的核苷酸模式,这些核苷酸模式描述了基因是否会表达。WGosai 等人应用人工智能 (AI) 方法来学习该语言的“调节语法”,即基因组中与基因调控活动相关的核苷酸模式,以适应不同的细胞类型。然后,作者将这些模型与实验基因组学技术一起应用,以创建可以驱动特定细胞类型中基因表达的合成 DNA 序列,这对靶向细胞和基因治疗具有意义。
创建可靶向特定细胞群的合成序列的能力源于实验基因组学和 AI 的进步。在过去的 15 年里,分子生物学领域见证了大规模平行报告基因检测 (MPRA) 的发展,该检测可测量基因组中数十万个“调节元件”的活性。这些短序列位于基因之间,通常包含转录因子的结合位点。调节元件是否活跃(即结合激活转录因子)取决于细胞类型,因此这些序列以细胞类型依赖性方式驱动基因的表达。使用 MPRA,可以识别哪些调节元件在给定的细胞类型中具有活性,从而有效地使特定细胞类型成为“靶向”。今年早些时候,与 Gosai 及其同事位于同一实验室的研究人员描述了他们应用这项技术来评估与人类疾病相关的数十万种突变如何影响不同的细胞类型。
与此同时,过去十年中彻底改变图像分析的 AI 技术也提高了科学家在不同类型的细胞中学习基因组语言的能力。例如,人工神经元网络(称为卷积神经网络或 CNN)可以学习图像的特征,使它们能够区分猫的图像和狗的图像。同样,CNN 可以学习调节元件的重要基因组序列特征,从而能够区分细胞类型,例如导致基因表达在一种细胞类型中而不在另一种细胞中表达的转录因子结合位点的组合。
在目前的研究中,Gosai 及其同事整合了这些新兴的计算和实验技术:MPRA 进行的测量作为训练基因组 AI 模型的输入。训练后,这些计算模型生成合成的调节元件序列,这些序列模拟了模型训练所依据的自然序列的细胞类型特异性(图 1)。MPRA 还提供了测试这些合成序列中哪些对某些细胞类型最具特异性的方法。应用这种方法,研究人员表明,他们的合成序列以比自然界中发现的任何调节元件更特异性于靶细胞的方式驱动基因表达。
Gosai 及其同事的研究是通过将 AI 和实验生物学紧密结合来加速生物学发现的更广泛趋势的一部分。一对研究。2023 年 12 月在线发布 报道了创建数百个合成序列的人工智能方法的发展,其功能可以在果蝇中进行测试。人工智能和实验生物学的整合也越来越多地用于其他领域,例如,创造用于基因组编辑的 CRISPR 蛋白,其脱靶效应比自然界中发现的任何此类蛋白质都要少7.这些和其他发现标志着基因组学领域从描述生物学到工程化的转变。
创建高度特异性合成序列的能力在细胞和基因疗法中具有令人兴奋的应用,其中致病细胞或基因(例如那些携带突变的细胞或基因)被功能性细胞或基因取代。设计基因疗法的主要挑战之一是避免脱靶效应。在一种细胞类型中替换功能失调的蛋白质可以带来有效的治疗,但如果将相同的蛋白质递送到不同类型的细胞,则会导致毒副作用8.因此,在特定细胞群中活跃的合成序列有可能限制多种基因疗法的毒性。
在这项技术进入临床之前,仍有根本的障碍需要克服。目前,测量数千个基因组序列功能的能力仅限于果蝇,以及培养皿中生长的培养细胞。这些细胞的某些特征可能无法很好地转化为人类。Gosai 及其同事描述的替代 AI 方法依赖于人类数据,但到目前为止,仅在少数细胞类型中得到验证,例如不同类别的神经元。
在合成序列创建的情况下,弥合实验室和临床之间的差距可能涉及新的计算和实验技术的整合。生成式 AI 方法类似于聊天机器人 ChatGPT 的基础,可以促进构建计算模型,这些模型比当前方法更有效地推广到不同的细胞类型和物种。在实验工作方面,一种称为空间转录组学的方法,其中基因表达谱可以映射到组织切片中,使研究人员能够在组织环境中测量数百个候选合成调节元件的特异性。
除了创建合成序列之外,进一步整合新兴的计算和实验技术还有巨大的潜力。下一代生物学家、计算生物学家和生物医学工程师将需要接受培训,使他们能够与其他学科的研究人员合作,或者更令人兴奋的是,他们能够自己整合这些高度复杂的领域。
原文链接:https://www.nature.com/articles/s41586-024-08070-z
国自然试听课来扫码申请!
本次国自然试听课全程录像,如需要回看录像的,请扫码下方二维码免费领取