【Nat. Commun】冷泉港研究团队揭示植物双向表达增强子与驯化的秘密

学术   2025-01-03 07:05   上海  

来源:PBJ

玉米作为全球重要的粮食作物,其驯化历程一直是科学界关注的焦点。近日,一项名为 MaizeCODE 的研究取得重大进展,来自美国冷泉港实验室的研究团队在Nature Communications上在线发表了题为“MaizeCODE reveals bi-directionally expressed enhancers that harbor molecular signatures of maize domestication”的研究论文,为我们深入理解玉米驯化过程中的基因调控机制提供了全新视角。


MaizeCODE 研究采用了类似 ENCODE 的策略,对玉米基因组中的调控区域进行了全面梳理。研究人员精心挑选了包括硬秆(B73)、非硬秆(W22)和热带玉米(NC350)等不同类型的玉米自交系,以及玉米祖先野生种大刍草(TIL11),通过对这些材料的多个组织进行分析,获取了丰富的组蛋白修饰、转录因子 ChIP-seq 以及转录组学数据。

首先,研究人员运用 ChIP-seq 技术对玉米自交系 B73、W22、NC350 和大刍草自交系 TIL11 的多个组织进行分析,检测 H3K27ac、H3K4me1、H3K4me3 等组蛋白修饰在基因组上的分布情况,同时结合 RNA-seq、RAMPAGE 和 DNS-seq 技术获取转录信号信息。通过特定的数据分析流程(如 MaizeCODE 管道)对测序数据进行处理,包括去除接头、质量评估、序列比对(bowtie2 用于 ChIP-seq,STAR 用于 RNA 相关测序)、峰检测(Macs2)等。结果显示,H3K27ac、H3K4me3 在转录起始位点(TSS)和基因末端(TES)附近富集,H3K4me1 在基因体上富集且与转录信号相关;在未成熟穗中,活跃的调控元件(LoOCR 和部分 dOCR)富含 H3K27Ac 和 H3K4me3,H3K4me1 在 dOCR 中大多缺失,且 H3K27ac 沉积在开放染色质区域(OCR)两侧核小体上;部分 H3K27ac 峰不与 ATAC-seq 定义的 OCR 重叠但有相似富集值;多数调控区域在组织间共享,组织特异性峰多位于远端元件,且远端调控元件分布在距最近基因特定距离范围内。这些结果为后续研究玉米基因调控机制提供了重要的基础数据,揭示了组蛋白修饰在基因表达调控中的关键作用以及调控区域在不同组织中的分布规律。(图1)


图1 组蛋白 H3 修饰标记玉米自交系中的 DNA 调控元件
针对部分转录因子(如 TU1 - A - YFP、GT1 - YFP 等),研究人员将其转基因系引入特定突变背景(bd1;Tunicate (bd1;Tu) 双突变背景)以获取大量组织用于 ChIP - seq 实验。组织经交联、免疫沉淀后,构建 ChIP - seq 文库(使用 NEXTflex ChIP - seq Kit 和 AMPure XP beads)并进行 Illumina 测序,获取转录因子结合位点信息。对 ChIP - seq 数据进行质量控制、比对、峰检测(Macs2)等处理流程,同时利用 Meme suite 分析转录因子结合基序。结果表明,多数转录因子结合位点(TFBS)与 H3K27ac 峰重合,主要分布在基因体或远端区域,体现了转录因子之间的相互作用;各转录因子具有特定的结合基序,代表其家族和 DNA 结合域特征;在重要的驯化基因(如 TB1、GT1、RA1 和 TGA1)位点,转录因子呈现复杂的调控模式,包括共调控和自调控,表明这些转录因子在玉米驯化过程中的基因调控网络中发挥着关键作用,对深入理解玉米驯化相关基因的调控机制具有重要意义。(图2)

图2 驯化基因的增强子受转录因子网络调控

通过 RNA - seq、RAMPAGE 和 shRNA - seq 技术对玉米多个自交系(包括 B73、W22、NC350 等)的不同组织(成熟花粉、未成熟穗、根尖、胚乳、胚芽鞘节)进行研究。运用 RNA - seq 分析基因表达差异(借助 EdgeR 进行差异表达分析),RAMPAGE 检测转录起始位点,shRNA - seq 研究小 RNA 分布情况。数据处理时,按照标准流程进行质量评估、序列比对(RNA - seq 和 RAMPAGE 用 STAR 比对,shRNA - seq 经 rRNA 去除后用 Shortstack 分析)。结果显示,花粉的基因表达谱与其他组织差异显著,有大量基因差异表达;花粉中独特转录起始位点最少,且组织间共享位点多映射到注释基因,花粉或胚乳特有的转录起始位点多位于转座子和基因间区域;花粉中多数小 RNA 簇独特且映射到转座子(特别是 LTR 逆转录转座子),不同组织中小 RNA 大小分布也存在差异。这些结果突出了花粉在转录水平的独特性,为深入探究花粉发育、生殖过程以及与其他组织在基因表达调控上的差异提供了重要依据。(图3)


图3 花粉与其他组织相比具有独特的转录谱

研究人员利用 shRNA - seq 技术对玉米和大刍草自交系(如 B73、NC350、W22、TIL11)的多个组织(花粉、胚乳、根尖、未成熟穗、胚芽鞘节)进行小 RNA 测序,计算不同大小(21nt、22nt、24nt 等)小 RNA 的分布频率(CPM)以分析其在组织和自交系间的差异,同时运用 RNAfold 软件对代表性花粉特异性发夹结构进行二级结构预测。研究发现,玉米和大刍草自交系在胚芽鞘节中的小 RNA 大小分布相似,但在其他组织中存在差异,如 B73 花粉中积累更多 24nt sRNA,TIL11 未成熟穗中 24nt sRNA 水平较低而 21nt sRNA 水平较高;花粉中存在产生高水平 22 和 24nt sRNAs 的长非编码发夹结构,其在花粉和胚芽鞘节中的表达模式不同,且在花粉中还产生 21nt sRNAs,不同组织中 24nt sRNAs 的全基因组分布差异显著。这些结果揭示了小 RNA 在不同组织和自交系中的分布特异性,为理解小 RNA 在玉米发育过程中的功能和调控机制提供了关键信息。(图4)


图4 不同组织和自交系中小 RNA 大小分布不同

研究人员整合了 ChIP - seq(用于检测组蛋白修饰 H3K27ac、H3K4me1、H3K4me3 和转录因子结合位点)、RNA - seq、RAMPAGE、DNS - seq(用于检测 DNA 可及性)、shRNA - seq(用于检测小 RNA)以及已发表的 DNA 甲基化数据。对这些数据通过 MaizeCODE 管道进行处理,包括预处理、比对、峰检测等操作,同时利用 STARR - seq 数据评估增强子活性。结果显示,在远端调控区域中,具有双向表达增强子 RNA(eRNA)的增强子具有独特分子特征,其具有 5’帽结构(RAMPAGE 信号),边界处有更高水平的 24nt siRNAs 和 DNA 甲基化,内部产生更多 shRNAs,对 MNase 更敏感,且转录因子结合位点更丰富;与其他类型增强子(单向表达、不表达等)相比,双向表达增强子在体外具有更高的增强子活性,但在体内表达具有组织特异性;这些增强子长度有限且与增强子活性无明显关联,同时约一半存在于染色质环中,与基因表达有一定关联。这些结果为深入理解玉米中具有双向 eRNA 的增强子在基因调控中的作用机制提供了全面而重要的数据支持。(图5)

图5 具有双向增强子 RNA 的增强子在边界处具有更强的活性和更高的 RdDM 信号

研究人员运用 Hi - C 技术研究玉米染色质构象,确定染色质环的结构和位置,将基于 H3K27ac 峰及相关特征定义的增强子区域与染色质环进行关联分析,统计不同类型增强子(根据 H3K4me1 峰存在与否及 RNA 表达情况分类)在染色质环锚点和环内的分布比例,并评估其与基因表达的关系(通过比较相连基因的表达水平)。同时整合 GRO - seq 数据(利用 dREG 算法重新分析),将其鉴定的具有双向新生转录本的元件与本研究中的 H3K27ac 峰进行交集分析,结合 RAMPAGE 数据评估增强子 RNA 的表达情况(如 capped 转录本比例)。结果表明,具有双向增强子 RNA(eRNA)的增强子在染色质环中的富集情况与基因表达水平有一定关联,约一半存在于染色质环中;与随机形成染色质环的基因相比,与双向表达 eRNAs 增强子相连的基因表达更高,但仅略高;本研究鉴定的双向转录增强子与 GRO - seq 数据部分重叠,且在双向增强子中,30% - 70% 的增强子 RNA 是有帽的,部分具有单链 RNA - seq 转录本的增强子也显示双向 RAMPAGE 信号,意味着双向表达增强子的数量可能被低估。这些结果有助于深入理解增强子与基因之间的远程调控机制以及增强子 RNA 的特性。(图6)

图6增强子 RNA 表达区域在染色质环中富集

通过对大刍草(TIL11)和现代玉米自交系(B73、W22、NC350)不同组织的 RNA - seq 数据进行差异表达分析(运用 EdgeR),确定差异表达基因(DEGs),借助 Ensembl Compara Trees 确定同源基因关系,以冲积图展示 DEGs 在不同组织中的保守性,从而分析驯化对基因表达的影响;同时利用 PhastCons 和 Conservatory CNS 方法,基于全基因组比对和进化模型确定保守元件,将其与本研究鉴定的增强子区域(根据 H3K27ac 峰定义)进行交集分析,计算含有保守区域的增强子百分比,以柱状图展示不同组织中增强子保守性的差异。结果显示,花粉中的基因表达模式在驯化过程中相对保守,而未成熟穗中的基因表达和调控元件在驯化过程中发生了较大变化,许多在大刍草中差异表达的基因在现代玉米中失去了组织特异性,同时出现了一些在玉米中无近缘同源基因的新基因;在增强子保守性方面,除未成熟穗外,各组织中具有双向 eRNAs 的增强子含有更多保守区域,进一步说明未成熟穗的调控元件受驯化影响显著,为研究玉米驯化过程中的基因调控进化提供了有力证据。(图7)


图7 驯化对玉米穗的转录谱和增强子影响更大

MaizeCODE 研究成果不仅加深了我们对玉米基因调控网络的理解,还为玉米驯化研究提供了宝贵资源。这些数据有助于进一步探索玉米的进化历程,为未来的玉米遗传改良和育种工作提供了重要的理论依据。


原文链接:

https://www.nature.com/articles/s41467-024-55195-w


为了不让您最关心的内容被湮没

防止我们一不小心失散

快把“iPlants”设置为星标吧★

只需三步↓↓

文章顶部点击「iPlants」名称进入公众号主页,点击右上角「三个小点」,点击「设为星标」,iPlants名称旁边出现一个黄色的五角星,就设置成功啦~


微信加群
iPlants专注于全球植物科学前沿研究报道,已有二十万多学者关注。现已组建了30个500人/群的植物科学研究的研究生/教授的实名认证交流群,其都来自全球各大高校和研究所的同学和老师。欢迎从事植物科学相关研究的同学和老师加入我们,一起讨论学术和梦想。温馨提示:iPlants助手微信号(ID: iplants-1)或长按下面二维码进群时,请备注一下学校+专业+学生/老师,以便我们能拉你进相应的交流群,否则不予通过)
投稿、商务合作、转载开白名单等事宜请联系微信ID:iplants或18321328797 或邮箱:703131029@qq.co


iPlants
传递有趣的、有意义的植物科学研究
 最新文章