本研究探讨了可转座元件(transposable elements, TEs)在毛竹(Moso bamboo)幼苗中对非生物胁迫的应答及其表观遗传变化。TEs是真核基因组的动态组成部分,受表观遗传变化的影响,能够通过复制-粘贴和切割-粘贴两种机制在基因组内移动。逆转录转座子(Class I)通过RNA中介使用复制-粘贴机制,而DNA转座子(Class II)则使用剪切-粘贴或复制机制。TEs可以被激活或沉默,其转座可能对植物基因组产生有益或有害的影响。大多数TEs因其潜在的有害效应而保持不活跃状态,沉默机制包括转录前的DNA甲基化和组蛋白修饰(转录沉默)以及转录后的RNA沉默(后转录沉默)。
研究表明,DNA甲基化在调节TE活性和维持基因组稳定性方面起着关键作用。TE的去甲基化会导致其激活,进而影响基因表达。例如,在玉米(Zea mays L.)中,氮肥施用后,Mutator(MuDR)转座子的末端倒位重复(TIRs)区域的DNA甲基化水平下降,导致MuDR-A和MuDR-B的表达增加。TE衍生的长非编码RNA(TE-lncRNAs)在拟南芥(Arabidopsis thaliana L.)、水稻(Oryza sativa L.)和玉米中分别占所有转录lncRNAs的22.9%、49.7%和51.5%,并参与特定的应激反应。
毛竹是生长最快的物种之一,约占中国竹类种植面积的73.76%,但在非生物胁迫下其栽培显著减少。研究发现,毛竹的转录因子(TFs)数量较谷物更多,且在非生物胁迫下表现出差异响应的基因包括PeDREB2A、PeDREB1A等。TEs在毛竹基因组中占比超过63%,对其发育和适应性至关重要。尽管TE在基因组改造中发挥重要作用,但毛竹在非生物胁迫下TE的表观遗传变化尚未得到充分研究。
本研究旨在填补这一空白,调查了毛竹幼苗在冷、热、紫外线和盐胁迫下TE活性与DNA甲基化模式之间的关系。结果显示,TE、TE-lncRNAs和TE-circRNAs在这些胁迫条件下的甲基化模式有所变化,基因网络分析揭示了Pe-TE-lncRNA3和Pe-TE-circRNA3在热和紫外线胁迫响应中的作用。这项研究加深了对TE活性与其甲基化模式之间相互作用的理解,为毛竹的胁迫响应提供了宝贵的见解。
主要结果
毛竹中的LTR逆转录转座子和TIR转座子的DNA甲基化
本研究分析了毛竹(Moso bamboo)中可转座元件(transposable elements, TEs)在不同非生物胁迫条件下的甲基化模式。约80%的TEs在这些胁迫下表现出甲基化。研究计算了长末端重复(long terminal repeat, LTR)逆转录转座子和末端倒位重复(terminal inverted repeat, TIR)转座子的CG、CHG和CHH甲基化水平,结果显示LTR和TIR转座子的CG和CHG甲基化水平在TE体内较侧翼区域显著更高。
具体而言,LTR逆转录转座子和TIR转座子的CG和CHG甲基化水平在TE体内达到峰值,分别约为95%和82%。CHH甲基化水平在两类TE的侧翼和体内区域之间差异较小(约1%)。LTR逆转录转座子的编码区域包含至少五个蛋白质结构域:群体特异性抗原(GAG)、蛋白酶(PR)、逆转录酶(RT)、RNase H(RH)和整合酶(INT),根据其结构域的顺序,LTR逆转录转座子被分为Ty1/copia和Ty3/gypsy两个超家族。
在分析Ty1/copia和Ty3/gypsy的LTR及编码区域的甲基化模式时,发现CG和CHG甲基化水平在LTR区域逐渐增加,而在编码区域相对稳定。具体来说,LTR区域的CG甲基化水平从约70%增加到95%,而CHG甲基化水平从约55%增加到80%。相反,Ty1/copia和Ty3/gypsy的CHH甲基化水平在所有区域均保持较低(约3%)。
对于TIR转座子,hAT、ENspm和MULE在TIR区域的CG和CHG甲基化模式表现出先上升后下降的趋势,这与LTR逆转录转座子的持续增加趋势显著不同。在编码区域,hAT的CG和CHG甲基化水平也表现出类似的变化趋势,而ENspm和MULE的变化则较小。
活跃的转录元件及其相关的甲基化模式
在非生物胁迫下鉴定差异甲基化的转座子
本研究使用DSS v2.12.0软件识别了在非生物胁迫下的差异甲基化可转座元件(differentially methylated transposable elements, DMTs),通过比较C4与对照组(CK)、H42与CK、UV与CK以及盐(Sa)与水(Wa)组。结果显示,在冷、热、紫外线(UV)和盐胁迫条件下,分别识别出19,411、18,255、17,835和12,036个DMTs。其中,CHG甲基化背景下的DMTs数量最多,占总数的65%以上,表明CHG甲基化变化在这些胁迫条件下最为普遍。
在CG和CHG背景下,Ty3/gypsy超家族的DMTs数量最高,而在CHH背景下,hAT超家族的DMTs数量最多。具体而言,在冷、热、UV和盐胁迫条件下,分别观察到8340、7495、7525和7338个特异性DMTs。尽管在非生物胁迫下超甲基化现象占主导地位,但去甲基化TE的比例也不容忽视。例如,在冷胁迫下,CG、CHG和CHH背景下分别检测到2556、10,305和705个超甲基化TE,以及1930、3105和810个去甲基化TE。
在非生物胁迫下的TE表达模式
本研究对可转座元件(transposable elements, TEs)的表达模式进行了分析,结果显示大多数TE在非生物胁迫下被沉默,只有少部分被转录。具体而言,在冷、热、紫外线(UV)和盐胁迫条件下,分别有约5%(48,447)、10%(104,162)、9%(87,986)和8%(74,442)的TE被表达。而对照组CK和Wa的表达TE比例分别为11%(110,533)和10%(131,721)。
进一步分析TE表达与其甲基化水平的关系发现,约85%的甲基化TE在非生物胁迫条件下或对照组中未被表达。值得注意的是,CHH甲基化下沉默的TE数量大于CG和CHG甲基化下的TE数量,这表明尽管CHH甲基化水平相对较低,但可能在TE沉默中发挥重要作用。此外,Spearman相关分析显示CG和CHG背景下TE表达与甲基化水平之间存在显著的负相关,这进一步支持了甲基化在TE表达调控中的作用。
在表达的TE中,分别有11,376、4,982、4,114和3,627个TE在冷、热、UV和盐胁迫下表现出差异表达。其中,冷、热、UV和盐胁迫下的上调TE数量分别为1,101、2,970、2,316和538,而下调TE数量分别为10,275、2,012、1,978和3,089。Ty3/gypsy超家族在非生物胁迫下的差异表达TE中最为丰富,其次是Ty1/copia和MULE超家族。
此外,在冷、热、UV和盐胁迫下,分别有185、125、89和31个TE同时表现出差异甲基化和差异表达。在冷胁迫下,110个TE表现出超甲基化且表达水平降低,而6个TE表现出去甲基化且表达水平升高。在热胁迫下,28个TE超甲基化且表达水平降低,23个TE去甲基化且表达水平升高。在UV胁迫下,24个TE超甲基化且表达水平降低,15个TE去甲基化且表达水平升高。在盐胁迫下,13个TE超甲基化且转录下调,3个TE去甲基化且转录上调。这些结果表明,这些TE的DNA甲基化可能直接负向调控其转录活性。
毛竹中转座子长链非编码RNA和转座子环状RNA的鉴定
本研究分析了长链非编码RNA(long non-coding RNAs, lncRNAs)和环状RNA(circular RNAs, circRNAs)与可转座元件(transposable elements, TEs)之间的重叠情况,结果显示共有58,624个lncRNAs源自TEs,占总lncRNAs的约12.4%。其中,42,176个lncRNAs完全被TE覆盖。大多数TE-lncRNAs(58,584/58,624)属于大间隔非编码RNA(large intergenic noncoding RNA, lincRNA)类别,此外还有40个反义lncRNAs也源自TEs。
对TE-lincRNAs与非TE-lincRNAs的特征比较发现,两组之间的长度分布相似。大多数lincRNAs,包括TE-lincRNAs和非TE-lincRNAs,都是单外显子转录本。这表明TE对毛竹中lincRNAs长度的扩展影响较小。此外,TE-lincRNAs在CK和H42条件下的表达水平显著高于非TE-lincRNAs。
有趣的是,80%(47,281/58,624)的TE-lncRNAs源自Ty3/gypsy和Ty1/copia超家族,而15%(8,607/58,624)源自DNA转座子。仅有一小部分(4%;2,345/58,624)的TE-lncRNAs源自LINE/L1和SINE/L1超家族。与TE-lncRNAs相比,仅有110个circRNAs(约占总circRNAs的11%)源自TEs。进一步比较TE-circRNAs与非TE-circRNAs的表达及注释外显子数量发现,TE-circRNAs的表达水平显著高于非TE-circRNAs。
注释外显子的分布显示,非TE-circRNAs(包括多外显子circRNAs)比TE-circRNAs更频繁地形成环状结构。进一步分析表明,85%(93/110)的TE-circRNAs源自Ty3/gypsy和Ty1/copia超家族。这些发现表明,作为两大类逆转录元件,Ty3/gypsy和Ty1/copia超家族在编码lncRNAs和circRNAs中发挥了重要作用。
鉴定差异甲基化和表达的TE-lncRNAs和TE-circRNAs
本研究识别了在冷、热、紫外线(UV)和盐胁迫下的差异甲基化可转座元件长链非编码RNA(differentially methylated transposable element long non-coding RNAs, DM-TE-lncRNAs),分别为1246、1138、1138和723个。与DNA甲基化模式(differentially methylated transposable elements, DMTs)一致,DM-TE-lncRNAs中CHG甲基化背景的比例最高。在这些DM-TE-lncRNAs中,分别有591、544、491和521个特异于冷、热、UV和盐胁迫。值得注意的是,许多TE-lncRNAs在响应两种或多种胁迫处理时表现出差异甲基化,例如,有36个TE-lncRNAs在所有四种非生物胁迫条件下均表现出差异甲基化。
在冷胁迫下,发现的DM-TE-lncRNAs数量最多(1293个)。在冷、热和UV胁迫下,超甲基化TE-lncRNAs的数量超过了去甲基化TE-lncRNAs的数量,但在盐胁迫下则相反。这些结果表明,TE-lncRNAs可能作为非生物胁迫反应的共同组成部分,在表观遗传水平上发挥作用,特别是在盐胁迫下,DNA甲基化在调控TE-lncRNAs中起着重要作用。
转录分析显示,在冷、热、UV和盐胁迫下,分别有1101、786、633和515个可转座元件长链非编码RNA(differentially expressed transposable element long non-coding RNAs, DE-TE-lncRNAs)表现出差异表达。大多数DE-TE-lncRNAs特异于各自的胁迫条件。在冷和盐胁迫下,DE-TE-lncRNAs的表达主要下调,而在热和UV胁迫下则主要上调。
对于环状RNA(circRNAs),在冷、热、UV和盐胁迫下分别识别出21、15、19和13个差异甲基化可转座元件环状RNA(differentially methylated transposable element circular RNAs, DM-TE-circRNAs)。观察到TE-circRNAs的超甲基化和去甲基化现象。此外,在冷、热、UV和盐胁迫下,分别有9、4、16和3个TE-circRNAs表现出差异表达。差异甲基化和差异表达的TE-circRNAs之间重叠很小,这表明TE-lncRNAs和TE-circRNAs的DNA甲基化水平变化与其表达水平之间没有直接相关性。
TE-lncRNA靶基因的特征描述
为探讨差异表达可转座元件长链非编码RNA(differentially expressed transposable element long non-coding RNAs, DE-TE-lncRNAs)的生物功能,研究通过共表达分析和位置接近性预测了其靶基因。在冷、热、紫外线(UV)和盐胁迫下,分别识别出144、34、70和14个顺式调控(cis-regulated)基因,以及144、176、390和141个反式调控(trans-regulated)差异表达基因(differentially expressed genes, DEGs)。
值得注意的是,DE-TE-lncRNAs靶向了42个热休克蛋白(heat shock protein, HSP)基因和6个热胁迫转录因子(heat stress transcription factor, HSF)基因,这些基因在热胁迫下均表现出差异表达。这表明TE在通过调控lncRNAs来调节HSP表达方面发挥了关键作用。分析顺式作用元件时发现,DE-TE-lncRNAs自身及其编码区上游2000 bp内缺乏热休克元件(heat shock elements, HSEs),这表明DE-TE-lncRNAs可能通过反式作用机制调节HSP和HSF的表达。
进一步对TE-lncRNAs的假定靶基因进行了基因本体(Gene Ontology, GO)富集分析。结果显示,冷胁迫下TE-lncRNAs的假定靶基因显著富集于与磷酸化相关的术语,包括蛋白质修饰过程、磷酸化和蛋白质磷酸化。热诱导的TE-lncRNAs靶向的假定靶基因显著富集于与热胁迫反应相关的术语,如对热的反应、温度刺激反应和蛋白质结合。UV诱导的TE-lncRNAs则靶向与脂质代谢相关的基因,涉及细胞脂质代谢过程、脂肪酸合成过程和脂肪酸代谢过程。盐胁迫下TE-lncRNAs的假定靶基因显著富集于与碳水化合物代谢和细胞壁生物合成相关的术语,如转移酶活性、转移糖基、UDP糖基转移酶活性和细胞壁组织或生物合成。
这些结果表明,TE-lncRNAs的靶基因在四种胁迫处理下主要参与与磷酸化、热胁迫反应、脂质代谢、碳水化合物代谢和细胞壁生物合成相关的功能。
TE-circRNA靶基因的表征
为了探讨差异表达可转座元件环状RNA(differentially expressed transposable element circular RNAs, DE-TE-circRNAs)的生物功能,研究预测了其与miRNA和mRNA的调控网络。结果显示,在冷胁迫下,五个差异表达miRNA(DE-miRNAs)靶向五个DE-TE-circRNAs和55个差异表达mRNA(DE-mRNAs)。在这些DE-TE-circRNAs中,有两个(novel_circ_0002970和novel_circ_0010567)上调,而三个(novel_circ_0007709、novel_circ_0007200和novel_circ_0011313)下调。
在热胁迫下,七个DE-miRNAs靶向九个DE-TE-circRNAs和十四个DE-mRNAs。三种DE-TE-circRNAs(novel_circ_0010050、novel_circ_0006375和novel_circ_0011150)上调,而六种(如novel_circ_0005739、novel_circ_0004312和novel_circ_0004938)下调。在紫外线(UV)胁迫下,识别出14个DE-miRNAs靶向23个DE-TE-circRNAs和137个DE-mRNAs。在这些DE-TE-circRNAs中,12个(如novel_circ_0008554和novel_circ_0009788)上调,而11个(如novel_circ_0004312、novel_circ_0008887和novel_circ_0009352)下调。
有趣的是,在盐胁迫下未识别出任何调控网络。这些结果表明,DE-TE-circRNAs在冷、热和UV胁迫下与miRNAs和mRNAs之间存在复杂的调控关系,而在盐胁迫下则可能缺乏相关的调控机制。
验证 Pe-TElncRNA3、PeTEcircRNA3 及其靶基因的表达模式
研究发现,可转座元件长链非编码RNA(transposable element long non-coding RNAs, TE-lncRNAs)与mRNA之间存在共表达关系,表现出正相关和负相关的特征。值得注意的是,可转座元件环状RNA(transposable element circular RNAs, TE-circRNAs)通过调节miRNA的表达与mRNA共表达。为了进一步探讨应激响应的TE-lncRNAs和TE-circRNAs对靶基因的调控模式,研究对Pe-TElncRNA3(LNC_470233)、Pe-TEcircRNA3(novel_circ_0009352)及其靶基因在热胁迫和紫外线(UV)胁迫下进行了共表达分析。
在热胁迫(42°C,0、4、6和8小时)和UV胁迫(30 W,0、2、4和6小时)处理下,观察到其表达水平的变化模式。结果显示,在热胁迫下,PH02Gene25732(光合NDH亚基,叶腔位置5,PNSL5)的表达模式与Pe-TElncRNA3一致;而在相同的热胁迫条件下,PH02Gene25729(液泡蛋白分选相关蛋白60,VPS60)和PH02Gene03426(甘露糖内切酶7,MAN7)的表达模式则与Pe-TElncRNA3相反。这表明Pe-TElncRNA3可能在热胁迫下对靶基因的表达起到正向或负向调控的关键作用。
进一步分析显示,Pe-TEcircRNA3被miR396g内源性靶向。在UV胁迫下,Pe-TEcircRNA3的表达模式与miR396g相反,提示二者可能存在相互作用。此外,miR396g在UV胁迫下的表达模式与其靶基因(包括PH02Gene34658(F-box/LRR重复蛋白At3g03360)、PH02Gene46768(进口蛋白β样SAD2,SAD2)、PH02Gene42411(GDSL酯酶/脂肪酶At4g10955)和PH02Gene29026(生长调节因子5,GRF5))的表达模式相反。这些发现表明,Pe-TEcircRNA3可能通过与miR396g的相互作用在UV胁迫下调控这些靶基因的表达。
文献来源:
Ding Y, Zou L-H, Ramakrishnan M, Chen Y, Zhu B, Yu L, et al. Abiotic stress-induced DNA methylation in transposable elements and their transcripts reveals a multi-layered response in Moso bamboo. Industrial Crops and Products. 2024;210:118108.
其中的Ramakrishnan M大佬就是我们竹类所的那位。没想到随意找到一篇竹子转座子就有他的参与。