Annu Rev Plant Bio | 顺式元件在发育适应和进化的作用

2025-01-06 23:05   湖北  

2023年1月,美国佐治亚大学的Alexandre P. Marand等在Annu Rev Plant Biol杂志上发表题为"cis-Regulatory Elements in Plant Development, Adaptation, and Evolution"的综述。

该文章主要讨论了各类顺式调控元件( CREs )的功能和鉴定方法以及它们在植物发育和对环境响应中的作用。此外,还强调了利用植物发育和环境响应背后的顺式调控变异进行作物改良的潜力。尽管目前对植物顺式调控机制的全面理解与动物相比有所滞后,但作者展示了几个突破性的发现,这些发现深刻地影响了植物生物学,促进了科研人员对植物中顺式调控模块( CRMs )在发育、环境响应、适应和进化方面的理解。

顺式调控元件(cis-regulatory elements, CREs )通常聚集在顺式调控模块( cis-regulated module, CRMs )中,编码基因组蓝图,以确保适当时空模式的基因表达,从而保证适当的发育和对环境的响应。许多证据表明,基因表达的变化是真核生物产生新表型的主要来源,包括哺乳动物的疾病和癌症等急性表型。转录模式由CREs介导,尽管人们对转录机制理解较为深入,但对CRMs如何通过染色质动力学获得、维持和调节活性以及CRMs在不同环境中对表型变异的影响机制等方面的研究才刚刚起步。此外,影响顺式调控序列的基因和表观遗传变异在较长的进化时间尺度上已成为形态分化和局部适应性研究的一个重要主题。


CREs的种类和功能多样性



1. 核心启动子(Core Promoters)

核心启动子元件在基因转录起始位点( TSSs )周围的位置可预测(Fig. 1a),是最好理解的一类CREs,负责组装转录前起始复合物组分,进而启动基因的转录。核心启动子分布为狭窄或宽泛的结构域,并可以根据真核生物中不同的基序组合进行分类



2. 增强子(Enhancers)

增强子是能够以不依赖于位置和方向的方式调节靶基因的CREs (Fig. 1a)。我们对植物中增强子的研究刚刚开始,目前已证明其主要调节转录爆发频率而非mRNA生物合成的大小且缺乏自主启动转录的能力。研究表明,植物增强子的染色质和序列特征与后生动物中定义的增强子相比有共性但也有独特性。

在大型真核生物基因组中,很大比例的增强子可以在距离它们控制的基因相隔几百到上万个碱基远的序列中找到。因此,增强子参与染色质环(远端染色质区域之间影响转录结果的增强子和启动子与结合蛋白之间的三维相互作用)的调节方式,已在水稻、玉米和小麦中发现。



3. 沉默子(Silencers)

能够沉默基因表达的调控序列,被称为沉默子(Fig. 1a),很难对其识别鉴定。然而,最近的全基因组研究揭示了一些可能与沉默元件相关的染色质特征,包括PRC2的招募和H3K27甲基化的沉积等。



4. 绝缘子(Insulators)

在后生动物中,染色质的高级结构由CTCF转录因子调控,CTCF单体通过与黏连蛋白相互作用形成不同的结构域(Fig. 1b)。二级染色质CTCF -黏连蛋白结构域可以包含从几个到几百个基因的任何位置,并将CRM-基因相互作用限制在基因组序列中的空间邻近范围内,通常称为拓扑相关结构域( Topology-associated domain, TADs )。相比之下,植物中缺乏一个明确的CTCF同源物,但也表现出类似的高阶染色质组织。具有紧凑基因组的物种如拟南芥,似乎具有有限的TAD类似结构。在植物中,仅有少数具有绝缘体活性的CRE被发现,在多个植物模型中的一些研究已经合并到少数转录因子,特别是来自TCP家族的转录因子,因此在结构域水平上鉴定调控染色质组织的机制仍然是该领域的主要目标。




可及染色质区和顺势调控元件分析方法



1. 识别可及染色质区域的实验方法

活性CRMs可以通过它们在可及染色质中的出现来概括,从而许可转录因子DNA结合结构域与它们的靶序列之间相互作用。目前,已经开发了几种利用顺式调控活性和染色质可及性之间的内在关联来鉴定CRMs的全基因组分析方法。作者主要探讨了DNase-seq,MNase-seq,ATAC-seq和scATAC-seq这四种染色质可及性分析方法的各自优势以及在植物研究中的应用示例(Fig. 1c)。




2. 验证CRMs的实验方法

尽管许多研究已经通过染色质可及性图谱绘制了推定的CRMs的基因组位置,但很少有研究提供功能验证。作者概述了直接和间接评估假定的CRMs功能的补充方法。作者首先介绍了目前用定位转录因子结合位点的两种主要方法:染色质免疫共沉淀测序(ChIP-seq)和DNA亲和纯化测序(DAP-seq)(Fig. 1d)。此外,还重点介绍了目前将传统的CRMs功能验证的报告基因方法与高通量测序结合的新方法——自转录活性调控区测序(STARR-seq) (Fig. 1e),可实现高度并行的基因组范围的转录调控元件活性检测。作者还概述了研究人员从群体和比较基因组学研究中发现了基因组的可及区域富集功能性状的证据。还有一些研究表明,非甲基化区域( UMRs )记录了可能存在于特定组织或环境条件下的潜在ACRs。



发育


越来越多的证据表明,CREs的变异是发育和生物体表型的关键调节因素。作者详细介绍了顺式作用元件和反式调节因子在胚胎和胚后发育以及作物改良中的实际应用。目前,仅发现少数的TFs特异性地控制胚胎发育。大多数植物的发育过程主要发生在胚后,其中生长和细胞分化由TFs和激素信号网络调控,而激素信号以器官特异性方式受到环境因素的调节。通过精确育种或基因组工程对植物性状进行有针对性的调控可以提高作物生产力,并适应不同的环境。作物基因组中的顺式调控空间是一个尚未开发的基因调控变异库,包括时空特异性,直到最近才被很大程度上探索。通过在自然群体或未驯化的野生亲缘植物中进行QTL定位,作者介绍了已经发现的通过调控作物发育基因表达的序列改良性状的几个例子,如玉米的籽粒行数、水稻的闭穗表型和番茄的果实大小等。



环境响应


动态基因调控往往在响应环境条件时发生,作者主要介绍了针对环境应激响应中染色质和转录动力学的近期研究。众多学者通过分析拟南芥、马铃薯以及水稻等模式植物在光照、热、寒、盐和干旱等不同环境条件下的染色质和转录动态,发现不同胁迫处理下,可及性变化区域出现的频率差异较大,并且染色质的变化往往表现为可及性的定量变化,而非新增或减少的特定可及性区域。此外,研究发现,动态和静态染色质可及性是差异基因表达的基础,与发育相关的基因表达变化相反(Fig. 2d-f),环境诱导的快速转录变化很少与广泛的染色质可及性变异相关(Fig. 2a-c)。综合来看,染色质可及性的变化对环境的响应是微妙的,研究染色质可及性动态响应环境条件需要综合多种方法和细致入微的观察。



与进化和适应有关的CREs变异



目前对于CRMs在动物中引起性状变异已有详细研究,但有关顺式调控在植物种群的进化和近缘物种之间作用的研究才刚刚开始。作者简要介绍了目前种内自然变异和种间变异的研究进展,着力探讨了有关新的CRMs创建来源的研究。新的CRMs可以为进化和选择提供原始材料,以产生新的性状。CRMs的功能改变可能由于单核苷酸多态性和小的插入/缺失改变TF结合亲和力或者更大的插入通过多种机制影响CRM。同时,作者还探讨了转座子(Transposable element, TE)在创建新的CRMs方面的潜在作用。研究发现,TE运动可能对在基因附近产生新的CRMs中起关键作用(Fig. 3)。包含CRM的TE可能提供了可选择的优势,而更有可能被保留。因此,进一步的研究将有助于阐明转座子和其他遗传机制在创建新型CRM中的作用。


近些年,染色质可及性的研究迅速扩展了植物物种的顺式调控词汇,各类分析方法也在不断解析不同的顺式调控元件。顺式调控元件的染色质可及性变异允许对生物体内不同细胞环境中的基因组进行独特的解释,利用植物发育和环境响应背后的顺式调节变异进行作物改良的具有巨大潜力。

作者:弓奕

校对:侯豫康、朱艺漫

编辑:曲木欣尔

AIBioPioneer
分享人工智能,生物信息与植物生理的点点滴滴
 最新文章