本氏烟草(Nicotiana benthamiana)是一年生茄科烟草属植物,原产于澳大利亚北部地区,和用于制作香烟的普通烟草(N. tabaccum)是近缘物种。本氏烟草最为人知的是作为植物学和合成生物学研究的模式植物。本氏烟草凭借其对病毒的易感性和在瞬时基因表达的便利性成为了植物科学家的“宠儿”,同时它也是植物天然产物和疫苗异源合成的重要底盘生物。因此,解析本氏烟草的基因组密码对促进植物科学研究和生物制药产业具有重要的价值。本氏烟草是异源四倍体,由两个二倍体祖先在距今500万年-600万年杂交形成,之后基因组演化形成现今的19对染色体。本氏烟草基因组约为2.85Gb,其草图最早发表于2012年,之后的12年间多个改进版本的本氏烟草基因组陆续公布,组装质量有了很大提升,但仍然存在多个缺口与组装注释错误,严重影响了对这一模式生物的功能基因组学的研究进程。
着丝粒是负责细胞分裂过程中染色体平均分配给子细胞的基因组关键区域,也被称为基因组的暗物质区域。因其高度复杂并富含重复序列,着丝粒的序列很难被测序和破译。近年来随着测序技术和生物信息算法的快速发展,包括人类、拟南芥、酵母在内的多个模式生物以及玉米、水稻、辣椒、生菜等作物的着丝粒特征逐渐被揭示。这丰富了我们对这些基因组暗物质的认知,为疾病研究和治疗、作物单倍体育种、人工染色体合成等前沿科学提供理论指导。然而,我们对生物界着丝粒的结构和进化理解仍然处在初期,绝大多数生物的着丝粒区域仍未解析。此外,多倍体生物例如四倍体本氏烟草、四倍体马铃薯、六倍体小麦等,基因组经历了复制、重排和结构变异等事件,在此过程中着丝粒如何演化和维持功能也有待阐明。异源四倍体的本氏烟草为这些问题的解答提供了一个理想的模型。
2024年11月14日,国际著名期刊Nature Plants在线发表了北京大学现代农业研究院郭立团队题为“The complete genome assembly of Nicotiana benthamiana reveals genetic and epigenetic landscape of centromeres”的研究论文。该研究通过组装端粒到端粒(T2T)无缺口本氏烟草基因组,并包含所有着丝粒、端粒和核糖体DNA序列,是国际上首个报道的多倍体植物完整基因组。该研究对本氏烟草进行了亚基因组分型,进一步确定林烟草(N. sylvestris)和渐狭叶烟草(N. attenuata)最可能是其二倍体祖先物种。研究还深入解析了异源四倍体本氏烟草的着丝粒序列及其表观特征,丰富了我们对本氏烟草基因组进化和着丝粒演化过程的认识。本氏烟草完整基因组和注释也将加速其在遗传分析、改造及其在植物生物学中的应用。
图1. 本氏烟草T2T基因组全局特征、多倍体进化历史和着丝粒演化进程
研究团队首先采用最新的单分子测序技术(HiFi + ONT),Hi-C和Bionano光学图谱等多种技术相结合策略,构建了首个T2T无缺口的本氏烟草基因组(2.85 Gb),实现所有染色体的完整分型组装(图1),并鉴定到所有19个着丝粒和38个端粒,contig N50值达到146.4 Mb。随后的质量评估表明该基因组具有很高的碱基准确性和组装完整性。研究团队还进一步基于着丝粒特异结合蛋白CENH3的ChIP-seq数据,确定了本氏烟草基因组的完整着丝粒序列,并揭示了其着丝粒全景特征。令人惊讶的是,与辣椒和马铃薯等茄科作物的着丝粒(以LTR/Gypsy反转录转座子为主)不同,本氏烟草着丝粒不仅有Gypsy序列,而且存在大量的卫星(Satellite)DNA的重复阵列,暗示这些着丝粒特异的卫星重复序列是在本氏烟草中新出现的(图2)。经过仔细分析,研究团队证明了本氏烟草着丝粒卫星阵列可能起源于核糖体DNA的基因间间隔序列。此外,在着丝粒组蛋白CENH3优先占据的区域,Gypsy反转录转座子和核基因组线粒体插入序列(NUMT)广泛侵入本氏烟草着丝粒,表明这些DNA元件在着丝粒功能中起着至关重要的作用。有趣的是,NUMT在本氏烟草着丝粒中的插入具有很强的亚基因组偏好性,并且主要与母体着丝粒周围有关。亚基因组分析表明,卫星阵列的出现可能推动了多倍体后着丝粒的形成(图2)。最后,该研究提出一个模型来解释本氏烟草着丝粒的进化,即本氏烟草基因组在多倍化后通过新着丝粒形成、卫星序列扩展、反转录转座子的富集和NUMT整合而实现着丝粒进化(图1),丰富了我们对于茄科植物和多倍体植物着丝粒演化的认知。
图2. 本氏烟草着丝粒卫星重复序列推动新着丝粒的形成和进化
为了不让您最关心的内容被湮没
防止我们一不小心失散
快把“iPlants”设置为星标吧★
只需三步↓↓
文章顶部点击「iPlants」名称进入公众号主页,点击右上角「三个小点」,点击「设为星标」,iPlants名称旁边出现一个黄色的五角星,就设置成功啦~