北京时间2024年11月14日18时,《自然—植物》(Nature Plants)在线发表了北京大学现代农业研究院郭立团队题为“The complete genome assembly of Nicotiana benthamiana reveals genetic and epigenetic landscape of centromeres”的研究论文。
该研究组装了端粒到端粒(T2T)无缺口本氏烟草基因组,并包含所有着丝粒、端粒和核糖体DNA序列,是国际上首个报道的多倍体植物完整基因组。该研究对本氏烟草进行了亚基因组分型,进一步确定林烟草(N. sylvestris)和渐狭叶烟草(N. attenuata)最可能是其二倍体祖先物种。
研究还深入解析了异源四倍体本氏烟草的着丝粒序列及其表观特征,丰富了我们对本氏烟草基因组进化和着丝粒演化过程的认识。本氏烟草完整基因组和注释也将加速其在遗传分析、改造及其在植物生物学中的应用。
本氏烟草(Nicotiana benthamiana)是一年生茄科烟草属植物,原产于澳大利亚北部地区,和用于制作香烟的普通烟草(N. tabaccum)是近缘物种。本氏烟草最为人知的是作为植物学和合成生物学研究的模式植物。本氏烟草凭借其对病毒的易感性和在瞬时基因表达的便利性成为了植物科学家的“宠儿”,同时它也是植物天然产物和疫苗异源合成的重要底盘生物。因此,解析本氏烟草的基因组密码对促进植物科学研究和生物制药产业具有重要的价值。本氏烟草是异源四倍体,由两个二倍体祖先在距今500万年-600万年杂交形成,之后基因组演化形成现今的19对染色体。本氏烟草基因组约为2.85Gb,其草图最早发表于2012年,之后的12年间多个改进版本的本氏烟草基因组陆续公布,组装质量有了很大提升,但仍然存在多个缺口与组装注释错误,严重影响了对这一模式生物的功能基因组学的研究进程。
着丝粒是负责细胞分裂过程中染色体平均分配给子细胞的基因组关键区域,也被称为基因组的暗物质区域。因其高度复杂并富含重复序列,着丝粒的序列很难被测序和破译。近年来随着测序技术和生物信息算法的快速发展,包括人类、拟南芥、酵母在内的多个模式生物以及玉米、水稻、辣椒、生菜等作物的着丝粒特征逐渐被揭示。这丰富了我们对这些基因组暗物质的认知,为疾病研究和治疗、作物单倍体育种、人工染色体合成等前沿科学提供理论指导。然而,我们对生物界着丝粒的结构和进化理解仍然处在初期,绝大多数生物的着丝粒区域仍未解析。此外,多倍体生物例如四倍体本氏烟草、四倍体马铃薯、六倍体小麦等,基因组经历了复制、重排和结构变异等事件,在此过程中着丝粒如何演化和维持功能也有待阐明。异源四倍体的本氏烟草为这些问题的解答提供了一个理想的模型。
图1. 本氏烟草T2T基因组全局特征、多倍体进化历史和着丝粒演化进程
研究团队首先采用最新的单分子测序技术(HiFi + ONT),Hi-C和Bionano光学图谱等多种技术相结合策略,构建了首个T2T无缺口的本氏烟草基因组(2.85 Gb),实现所有染色体的完整分型组装(图1),并鉴定到所有19个着丝粒和38个端粒,contig N50值达到146.4 Mb。随后的质量评估表明该基因组具有很高的碱基准确性和组装完整性。研究团队还进一步基于着丝粒特异结合蛋白CENH3的ChIP-seq数据,确定了本氏烟草基因组的完整着丝粒序列,并揭示了其着丝粒全景特征。令人惊讶的是,与辣椒和马铃薯等茄科作物的着丝粒(以LTR/Gypsy反转录转座子为主)不同,本氏烟草着丝粒不仅有Gypsy序列,而且存在大量的卫星(Satellite)DNA的重复阵列,暗示这些着丝粒特异的卫星重复序列是在本氏烟草中新出现的(图2)。
经过仔细分析,研究团队证明了本氏烟草着丝粒卫星阵列可能起源于核糖体DNA的基因间间隔序列。此外,在着丝粒组蛋白CENH3优先占据的区域,Gypsy反转录转座子和核基因组线粒体插入序列(NUMT)广泛侵入本氏烟草着丝粒,表明这些DNA元件在着丝粒功能中起着至关重要的作用。有趣的是,NUMT在本氏烟草着丝粒中的插入具有很强的亚基因组偏好性,并且主要与母体着丝粒周围有关。亚基因组分析表明,卫星阵列的出现可能推动了多倍体后着丝粒的形成(图2)。最后,该研究提出一个模型来解释本氏烟草着丝粒的进化,即本氏烟草基因组在多倍化后通过新着丝粒形成、卫星序列扩展、反转录转座子的富集和NUMT整合而实现着丝粒进化(图1),丰富了我们对于茄科植物和多倍体植物着丝粒演化的认知。
图2. 本氏烟草着丝粒卫星重复序列推动新着丝粒的形成和进化
总之,该研究公布了模式植物本氏烟草的T2T无缺口基因组,并揭示了其着丝粒的全景结构及其表观遗传特征,作为国际上首个报道的完整分型多倍体植物基因组,该研究成果具有里程碑意义。本氏烟草完整基因组的破译不但为植物科学研究提供了重要的遗传资源,也将促进本氏烟草作为模式和底盘植物在生物技术领域的广泛应用。
鉴于该研究取得的重要突破,Nature Plants杂志在同期发表了Research Briefing评述文章“Unravelling the centromere landscape and evolution in the model plant Nicotiana benthamiana”,总结和点评了该研究的发现和意义。Nature Plants高级编辑Jun Lyu评论到:“这项研究的突出之处在于,它不仅提供了模式植物本氏烟草 LAB株系的完整分型基因组,而且促进了我们对该模式物种着丝粒组成和进化的理解”。此外,植物基因组和遗传学研究领域著名学者、澳大利亚昆士兰理工大学Peter Waterhouse教授点评:“本研究描述了本氏烟草的19条染色体中每条染色体的着丝粒和近着丝粒区域的鉴定和分析,这显然是一项新颖而引人注目的科学贡献。现有的本氏烟草染色体水平的基因组组装都没有定位到着丝粒,所以这项研究工作是一个重大的进步。对三种不同类型的着丝粒(Satellite,Gypsy和NUMTs)的鉴定是一个非常引人入胜的发现,让我们得以一窥这种快速二倍化的非整倍异源四倍体的进化过程”。
北京大学现代农业研究院郭立研究员为论文通讯作者, 陈为凯副研究员为论文第一作者。北京大学现代农业研究院科研助理陈绍英、孙杰、王靖萱、孟点、李君、进修教师张立立以及访问学生闫明也参与了该研究。
该研究得到了北京大学现代农业研究院高性能计算中心的技术支持,以及山东省重点研发计划(ZR202211070163)、山东省杰出青年基金(ZR2023JQ010)和山东省泰山学者的项目资助。
相关论文信息:
https://www.nature.com/articles/s41477-024-01849-y