入侵生物严重威胁当地生物多样性和生态系统功能。然而,相比于非入侵物种,入侵物种如何获得入侵性及怎样完成入侵过程仍然需要探讨。在遗传上,入侵物种的形成可能与基因渐渗、转座子富集或全基因组复制密切相关,因为这些过程通常会导致基因组的结构变异或遗传多样性的变化,从而加速了植物对新环境的适应。目前很多入侵物种的基因组仍然未知,这使得预测和管理入侵物种变得困难。要研究入侵过程中发生的基因组进化,我们首先需要获得多条高质量的入侵物种基因组序列,以便于进行比较基因组学研究。芦苇(Phragmites australis)是湿地生态系统中的一种常见的禾本科草类物种,在世界各地均有分布。芦苇具有很高的种内遗传多样性,并且对环境具有极强的适应性和可塑性。研究人员发现,本身不具有入侵特点的欧洲芦苇在迁移到北美后变得特别具有入侵性,在短短50年内从几个地点扩散到了美国全境。为此,山东大学郭卫华团队联合芬兰赫尔辛基大学、丹麦奥尔胡斯大学等单位的科研团队,对芦苇的基因组及入侵机制进行了探索,相关研究近期发表在Nature旗下的Communications Biology。
论文通过对一株中国异源四倍体芦苇进行了高覆盖度Pacbio HiFi测序,并应用染色体三维构象技术(HiC)辅助组装,提供了一个高质量的、无间隙的、从端粒到端粒的芦苇参考基因组序列。该基因组包含24条常规染色体和一条B染色体及多条未分配到染色体上的片段。通过识别亚基因组的特异重复序列,这些染色体被分配到代表祖先物种的两套亚基因组A和D中。完全分相的亚基因组显示了显著的D亚基因组优势,并揭示了其二倍体祖先大约分化于3090万年前。此外,作者组装了三个其他地理谱系(北美Land谱系、北美本地谱系、地中海谱系)的基因组草图,并根据参考基因组将草图支架连接成染色体级别。将这些优化的基因组与已发表的芦苇北美入侵谱系的基因组草图进行比较基因组学分析,发现以串联重复形式的基因家族扩张可能有助于该谱系的入侵性。该研究为芦竹亚科禾草的基因组进化提供了重要启示,揭示了基因家族的扩张和串联重复等基因组进化特征对植物生物入侵的潜在增强作用,为深入理解植物物种入侵性的遗传基础和入侵植物管理防治提供了重要参考。 山东大学博士后王翠为论文第一作者,山东大学郭卫华教授和赫尔辛基大学Jarkko Salojärvi助理教授为论文的共同通讯作者,山东大学为论文第一单位。奥尔胡斯大学、山西大学、青岛农业大学等单位的研究人员也参与了本研究。论文受山东省自然科学基金青年项目(ZR2021QC119)、中国博士后科学基金会国际博士后交流基金、国家自然科学基金(U22A20558、32100304、31800299)、芬兰科学院基金等项目的支持。原文信息
Wang, C., Liu, L., Yin, M. et al. Chromosome-level genome assemblies reveal genome evolution of an invasive plant Phragmites australis. Commun Biol 7, 1007 (2024). https://doi.org/10.1038/s42003-024-06660-1
此外,第一作者王翠博士应邀在Springer Nature的研究社区的Behind the Paper栏目撰写博文,分享了研究背后的故事,特别是B染色体和基因倒位结构的有趣发现。下附原文翻译(原文为英文):揭示入侵性芦苇的基因组进化
芦苇是一种禾本科植物,几乎在全球任何地方都能茂盛生长。这种物种以其非凡的韧性而闻名,不仅能在干燥贫瘠的沙地上生长,还能在严酷的盐碱土壤中生存。大约200年前,欧洲谱系的芦苇被引入北美洲,自那时起,尤其是在过去的50年里,它因其入侵性而臭名昭著。有趣的是,欧洲的种群并没有表现出相同的入侵行为。这种生活方式的惊人变化促使研究人员探索其迅速转变为入侵物种的因素。尽管对此有兴趣,但由于缺乏高质量的基因组组装,驱动这种转变的基因组变化在很大程度上仍未被探索。
在奥尔胡斯大学的Hans Brix维护的同质园里生长的芦苇
基因组测序技术的快速发展彻底改变了我们详细研究基因组的能力。我们的团队从2021年开始收集Pacbio HiFi长读测序数据,并结合染色体捕获信息(Hi-C),最终为芦苇提供了一个无间隙的、从端粒到端粒(T2T)的染色体级别基因组组装。尽管芦苇是异源四倍体,即两个不同植物物种的杂交,我们很高兴能够将所有假定染色体组装分配到两个亚基因组中的任何一个。我们首先在2023年2月举行的SMBE区域会议“基因组在生物入侵中的作用”上展示了这个组装。 当我们发现在组装中有一个意想不到的额外染色体时,我们觉得有点不太寻常。四倍体芦苇应当有24条单倍体染色体,但组装结果显示有25条。这个额外的染色体是否真正存在于细胞中呢?为了回答这个问题,我们在显微镜下观察了染色体中期分裂相,惊讶地发现真的有50条染色体。这条额外染色体序列主要由重复区域和其他24条染色体插入的片段组成。因此,我们得出结论,这应该是芦苇的B染色体。这一发现振奋人心,因为无间隙的T2T序列对于B染色体非常罕见——目前只有少数物种的B染色体被测序,而研究B染色体的模式植物之一玉米的B染色体在2021年才完成测序。芦苇中B染色体的发现为理解其基因组进化开辟了新的途径。通过分析代表其他谱系的五个个体的全基因组测序读覆盖率,我们发现入侵谱系在B染色体上的覆盖率更高,表明其相对于其他谱系可能具有有更多这个染色体的拷贝。B染色体上的基因大都富集在与基因表达调控、RNA合成和端粒维持相关的生物过程中。此外,我们在入侵谱系中发现了大量的串联重复基因,这些基因也大部分参与维持端粒和DNA的完整性,表明它们在入侵过程中可能发挥了重要作用。 A. B染色体与其他染色体/支架之间的同源片段数量(300bp大小)。未锚定到染色体上的支架被命名为HiC_scaffold。B. 显著富集在B染色体上的GO术语描述。前四个条形图表示细胞成分类别中的GO术语,其余的GO术语属于生物过程。C. 从顶部到底部的轨道显示了基因数量,CN、USland (Y7)、Med (Y21)、USnat (Y17)和EU入侵个体映射到参考基因组上的B染色体(Chr 24)和Chr 25的全基因组序列。注意入侵个体在B染色体上的读深明显高于Chr 25。D. 染色体B与主要基因组A(紫色)和D(黑线)的对比。该面板还包含与玉米染色体B(橙色)和染色体B自身(蓝色)的Ks图。
我们在芦苇基因组的研究之旅还有其他挑战。例如,在完成最终组装时,我们注意到染色体22在与水稻基因组对齐时显示出了与之前版本不同的同线性。好奇的是,Hi-C图像在两种情况下都显得完美。这最终让我们发现Chr22含有一个基因型倒位。观察芦苇基因组中的这种动态结构是令人着迷的,我们推测其无性繁殖的特性可能有助于维持这些独特特征。 在染色体22上检测到一个大的基因型倒位。Hifiasm同线性分析中两个基因型与水稻之间的两个haplotig组装(A和B)表明一个基因型(B)中发生了倒位。这种倒位在Hi-C接触热图中也很明显(C)。随着我们继续深入探究这种顽强且具有入侵性的禾草的基因组,每一次发现都会带来新的问题,以及对自然复杂性不断增长的惊奇。博文原文扫描下面二维码
(本期责编:刘乐乐)