NP|本氏烟草T2T基因组的组装以及着丝粒结构解析

科技   2024-12-13 23:53   北京  
2024年11月18日,北京大学现代农业研究院于“nature plants“上发表了题为“The complete genome assembly of Nicotiana benthamiana reveals genetic and epigenetic landscape of centromeres”的研究论文。

研究背景

本氏烟草是植物生物学中常用的模式植物,但由于四倍体基因组的复杂性,基因组尚未得到完整的组装。着丝粒区在细胞分裂中发挥了十分重要的作用,尽管功能保守,但着丝粒序列进化迅速,在不同物种间具有显著差异。同时,着丝粒区由于其内部和周围存在大量的重复序列,进一步增加了组装的挑战性。

研究内容

为了组装高质量烟草基因组,通过三代116.7×PacBio HiFi、47.9×ONT ultra long数据,初步得到了包含所有38个端粒,2845.07Mb的烟草基因组。随后,利用ONT ultra long数据对间隙区域进行补充,利用核糖体DNA重复序列对核仁组织区进行了补充。最终,获得了2849.3Mb大小的本氏烟草完整基因组,并注释了2247.3Mb的重复序列以及57023个蛋白编码基因。
本氏烟草是一种原产于澳大利亚的异源四倍体,但其二倍体祖先仍不清晰。为了解决这一问题,基于k-mer分析对其两个亚基因组进行了划分。根据同源基因的数量确定了同源染色体对,使用SubPhaser识别亚基因组特异性特征,发现51610个差异富集的k-mers,将同源染色体分为两个不同的组,同时主成分分析将11条染色体和9条染色体划分为两个亚基因组(图2a,b)。系统发育分析结果显示,A亚基因组来源于N. glaucaN. attenuata的姐妹类群(母系),而B亚基因组来源于N. sylvestris的姐妹类群(父系),并将本氏烟草的Illumina数据映射到五个烟草二倍体基因组,评估了二倍体物种对异源四倍体的基因组贡献程度(图2d,e)。同时,同源性分析显示两个亚基因组之间和内部发生了广泛的染色体重组以及基因丢失(图2g)。
通过分析着丝粒特异性结合蛋白CENH3的ChIP-seq数据,确定了本氏烟草基因组上的完整着丝粒序列,包含14条近端着丝粒染色体、2条亚端着丝粒染色体和3条亚中着丝粒染色体(图3a,b)。
进一步探究本氏烟草中的着丝粒结构特征,与多个代表性物种的着丝粒结构进行比较。系统发育分析显示,拟南芥、水稻和大豆的着丝粒往往有较长的卫星阵列;茄科植物着丝粒则主要由Ty3/Gypsy反转录转座子构成。然而,与这些茄科植物不同的是,本氏烟草着丝粒中不仅包含Gypsy型序列、还含有大量的卫星型序列(图4a)。通过TRASH对全基因组串联重复序列进行注释,发现11个着丝粒主要以33-bp和43-bp的微卫星为特征,此外还含有少量的209-bp和448-bp的卫星序列。这些卫星序列平均长度为2.20Mb,且与45S rDNA和5S rDNA片段显著相关(图4b,c)。卫星型着丝粒出现的机制一直不太清晰,在本氏烟草四倍体基因组中,找到了一段整个嵌入着丝粒的共线性模块,该模块在其他茄科物种中也具有保守性,但在其他物种中着丝粒都在此模块之外(图4d,e)。
叶绿体DNA(cpDNA)和线粒体DNA(mtDNA)在基因组进化过程中经常被转移到核基因组中,细胞器DNA 的核转移主要集中在异染色质区域。在本氏烟草基因组中共识别出113个长度为7.44Mb的NUMTs,且显著聚集于母系亚基因组(SubA)的着丝粒区域。因此,进一步分析了CENH3富集位点与卫星序列、Ty3/ Gypsy逆转录因子和NUMTs之间的关系。结果显示CENH3富集位点以Gypsy逆转录转座子为主、其次是卫星重复序列以及较少的NUMTs(图5a)。利用ChIP-seq数据进一步分析了表观遗传调控在维持染色体稳定性以及着丝粒功能中的重要作用,在卫星序列上显示出了与拟南芥相似的较高的H3K9me2修饰水平,但与拟南芥不同的是,本氏烟草的卫星序列上还显示出H3K4me3修饰的富集(图5b)。甲基化数据显示,本氏烟草着丝粒上富含CG以及CHG修饰,但卫星序列上的CHH修饰水平较低(图5c)。根据以上结果推测出一个着丝粒进化模型:首先通过CENH3蛋白在非着丝粒区域形成新着丝粒,随后在卫星序列扩展、着丝粒反转录转座子整合以及mtDNA的插入的下向成熟着丝粒过渡。
基于本研究的亚基因组分析和先前的报道,对本氏烟草基因组的进化史进行了总结。作为茄科植物成员,烟草属植物和茄属植物在大约2300万年前,进行了一次全基因组的三倍化事件,随后在约600万年前烟草属植物SylvestresNoctiflorae/Petunioides开始分化,并在约500万年-600万年间,经过一次杂交事件形成异源四倍体本氏烟草。异源多倍体在亚基因组之间在形成之后经历了广泛的重组和重排,并由于长期的基因组二倍体化最终引发染色体分裂融合、卫星序列出现、以及新着丝粒的形成,最终产生了现在的本氏烟草基因组(图6)。

评述

该研究利用PacBio HiFi和ONT ultra long测序技术,首次组装并注释了本氏烟草的完整基因组。在此基础上全面解析了本氏烟草着丝粒的结构特征与表观遗传修饰模式,并提出了新着丝粒形成以及其向成熟着丝粒演化的模型。该研究成果为植物科学研究提供了重要的遗传资源,并为多倍体植物基因组的解析打下了基础。


原文链接:

https://doi.org/10.1038/s41477-024-01849-y

评述:左权

编辑:兰浴倩

林木科学评论
聚焦林木科学与技术前沿,分享创新热点评论,服务林业科技提升。
 最新文章