Nature正刊|麻省理工-哈佛大学博德研究所:基于深度学习的合成顺式调控元件驱动细胞类型特异性基因表达

2025-01-08 11:14   湖北  

期刊:Nature

原题:Machine-guided design of cell-type-targeting cis-regulatory elements

译题:顺式调控元件的机器引导设计:驱动细胞类型特异性基因表达

DOI:10.1038/s41586-024-08070-z


1


Abstract

成果简介

摘要

    顺式调控元件(Cis-regulatory elements, CREs)调控基因表达,协调组织特性、发育时间及刺激响应,共同定义了人体内数千种独特的细胞类型。尽管CRE在需要组织特异性的治疗或生物技术应用中具有巨大潜力,但自然进化中未必产生了适合这些用途的最佳CRE。在此,我们提出了一种平台,用于工程化设计和验证合成CRE,能够实现编程化的细胞类型特异性基因表达。我们利用了深度神经网络对三种细胞类型的CRE活性建模的创新技术、高效的计算机优化以及大规模并行报告实验来设计并实证测试数千个CRE。通过大规模的体外验证,我们证明,与来源于人类基因组的天然序列相比,合成序列在驱动细胞类型特异性表达方面更为有效,并且在体内测试中能够在类似组织中达到特异性。合成序列表现出与目标细胞类型活性相关的独特基序词汇,同时显著减少了非目标细胞中的活性。总体而言,我们提供了一种通用框架,用于从大规模并行报告实验模型中前瞻性地设计CRE,并展示了开发适应特定需求的调控代码所需的能力。

关键词

顺式调控元件;深度学习模型;细胞特异性;


2


Figures

图文导读

图1:Malinois准确预测CRE转录激活能力


  • 目的:通过分析和实验验证,展示CODA方法如何利用机器学习设计高效的细胞特异性CRE,以满足不同的调控需求。

  • 展示:CODA平台从序列预测到优化设计的具体工作流程,并通过实验数据比较了天然 CRE 和合成CRE的细胞特异性活性,揭示合成 CRE 在多个细胞类型中的性能表现优于天然序列。

  • 结论:Malinois提供了高精度的CRE活性预测,与实验数据高度一致。证明了CODA平台在定制化基因调控设计中的巨大潜力。

图2:CODA 有效设计细胞特异性 CRE


  • 目的:通过分析和实验验证,展示 CODA 方法如何利用机器学习设计高效的细胞特异性 CRE,以满足不同的调控需求。

  • 展示:CODA 平台从序列预测到优化设计的工作流程,并通过实验数据对比天然 CRE 和合成 CRE 的特异性活性,揭示合成 CRE 在多个细胞类型中的优越表现

  • 结论:CODA 能高效生成满足目标细胞特异性需求的合成 CRE,展现出更高活性并抑制非目标细胞,显示其在基因调控设计中的应用潜力。

图3:功能性序列内容的解释


  • 目的:揭示CRE活性与序列基序之间的关系,分析这些基序对细胞特异性表达的贡献和调控模式。

  • 展示:图中通过分析 CRE 的核心基序,比较了合成 CRE 和天然 CRE 中基序的分布和使用情况,展示了合成 CRE 如何通过独特的激活与抑制基序组合提升目标细胞特异性,同时抑制非目标细胞活性

  • 结论:合成 CRE 采用了独特的基序组合策略,在目标细胞中显著增强活性,同时通过抑制非目标细胞中的相关基序活性,进一步提高了细胞特异性,为深入理解基因调控密码提供了新见解。

图4:合成 CRE 的体内验证

  • 目的:通过小鼠和斑马鱼实验验证 CODA 设计的合成 CRE 在活体中的特异性及其生物学功能。

  • 展示:图中展示了合成 CRE 在体内的 GFP 表达模式,其中肝细胞特异性 CRE 主要在肝脏部位表达,神经元特异性 CRE 则集中在大脑和神经组织中,进一步验证了设计的 CRE 的组织特异性和功能准确性。

  • 结论:CODA 设计的合成 CRE 在小鼠和斑马鱼体内实现了目标组织的特异性表达,同时抑制了非目标组织的活性。这些结果证明合成 CRE 在跨物种的基因调控研究中具有重要的应用价值,并为开发新型基因治疗工具提供了可靠方法

3


Ideas

创新点总结



一、基于深度学习的合成顺式调控元件(CRE)设计框架:


     文章提出了一种结合深度神经网络的全新平台,用于从头设计和优化合成 CRE。通过对三种细胞类型的 CRE 活性进行建模,框架可以精确预测序列的功能,并通过高通量实验验证其性能。这种从模型预测到实验验证的整合方法,显著提升了 CRE 的设计效率和细胞特异性。



二、合成 CRE 的定制化细胞特异性设计:


首次在体外和体内验证了设计的合成 CRE 不仅在目标细胞类型中显著提高基因表达活性,同时还能有效抑制非目标细胞的活性。这种利用特定基序组合设计的合成 CRE 在性能上优于天然序列,表明其在基因治疗和生物技术应用中具有巨大潜力。



三、跨物种验证的合成 CRE 适用性:


文章展示了在小鼠和斑马鱼中验证合成 CRE 的组织特异性和功能性,成功实现了跨物种的组织特异性表达。这一验证不仅证明了设计的 CRE 的普适性,还为合成调控元件在实际应用中的转化提供了强有力的支持。


AIBioPioneer
分享人工智能,生物信息与植物生理的点点滴滴
 最新文章