摘要
满江红(Azolla)是一个淡水蕨类植物属,其在经济上重要,作为固定氮的生物肥料、生物燃料、生物修复剂以及潜在的碳封存工具,但也包含一些入侵性。在加利福尼亚州,目前仅识别出两个物种,但可能有多达六个假定物种,这一差异源于物种鉴定的困难、杂交现象以及外来物种的引入。在此,我们报告了作为加利福尼亚保护基因组项目(CCGP)一部分的具有单倍型分辨率的、染色体水平的美洲满江红(Azolla caroliniana)基因组组装,采用了PacBio HiFi和Omni-C测序技术的组合。该基因组的长度为521 Mb,contig N50为1.6 Mb,已被组装为22个伪染色体。BUSCO完整性评分为87.5%,使其成为迄今为止最完整、最连续的满江红(Azolla)基因组组装。结合之前发表的细叶满江红(A. filiculoides)基因组,美洲满江红基因组将成为理解这一经济上重要且分类模糊的隐秘蕨类植物种群遗传学和分类学的重要工具,并促进更广泛的陆生植物基因组学研究。
图1 美洲满江红
背景介绍
满江红是一个微小的异孢浮水淡水蕨类植物属,其重要性超出常规(图1)。这些蕨类植物在叶片的袋状结构中寄生有专性内共生的固氮蓝藻,几个世纪以来被用作绿色生物肥料,常用于水稻生产。满江红被认为在生物肥料、植物修复和生物燃料方面具有巨大的经济和生态潜力,还被视为应对气候变化的碳封存方法——在始新世的满江红事件可能封存了足够的碳,使得热带的古新世-始新世气候最暖期转变为我们今天所拥有的寒冷地球(the ice-house planet)。然而,一些满江红物种被列为联邦有害杂草(美国农业部联邦有害杂草名单),而且缺乏关于物种数量、鉴别方法及其命名的共识。此外,该属物种已知有杂交现象,并且存在多倍体的案例。
在加利福尼亚州,目前仅识别出两个物种,但有多达五个描述的物种(A. caroliniana, A. filiculoides, A. mexicana, A. microphylla 和 A. rubra),以及至少一个未描述的物种(Rothfels and Li, unpublished),还有最近引入的A. pinnata ssp. pinnata。该群体的分类既复杂又具争议。通过开发满江红的基因组资源,我们可以开始了解哪些物种存在、如何区分它们、它们的分布和丰度,以及识别基因组多样性中心和连接模式。这些基因组资源还将有助于研究更广泛的进化问题,如异孢性的起源、微生物组的多样化以及共生体和细胞器的演化。
在此,我们报告了美洲满江红的单倍型分辨率染色体级基因组组装,该组装是加利福尼亚保护基因组项目(CCGP)的一部分。CCGP的目标是在全州组装和注释150个物种的高质量基因组,并结合全基因组重测序数据以识别多样性热点,并为保护和管理计划提供信息。美洲满江红基因组将成为理解这一最隐秘、经济上重要、有害且分类模糊的蕨类植物群体的景观基因组学和分类学的重要工具。
图2 美洲满江红单倍型基因组组装
我们提供了迄今为止最完整的满江红基因组,并且是槐叶苹目(Salviniales) 中第二个实现染色体水平组装的物种。我们的美洲满江红基因组组装有22个伪染色体,这也是满江红的预期单倍体染色体数(见图2B;《北美植物志》)。尽管大体上呈现共线性,美洲满江红的组装大小略小于细叶满江红的组装(540/521 Mb与623 Mb)。这种差异可能是由于重复内容的变异和/或污染过滤的方法不同造成的。如补充图1所示,满江红中含有多种内生菌,其基因组与宿主基因组一起被组装。用于区分植物与非植物序列的不同方法和阈值可能导致大小差异,特别是考虑到在组装细叶满江红基因组时并未纳入Hi-C接触信息。
美洲满江红和细叶满江红这两个基因组之间一个显著的差异是杂合度的水平——美洲满江红的杂合度较高,而细叶满江红的杂合度较低。用于细叶满江红测序的株系经过了几轮近交,目的是将其转变为实验室株系,因此其杂合度较低。另一方面,美洲满江红样本是直接从野外采集的。值得注意的是,美洲满江红的两个单倍体具有较高的contig N50,并已组装出22个伪染色体,从而代表了任何无种子陆生植物的第一个单倍型组装。
讨论
我们现在拥有两个高质量的满江红基因组:美洲满江红(本研究)和细叶满江红。考虑到该属的分类学不确定性,这些基因组资源将对物种划分极为重要。令人惊讶的是,我们的参考基因组是美洲满江红,而不是预期在加利福尼亚的小叶满江红(A. microphylla),这可能代表了其栖息地的重大扩张(美洲满江红被认为限于北美东部;《北美植物志》,1993年)或表明需要进行重大分类修订。
我们现在可以探究两个主要满江红亚属的基因组差异,其中一个包含A. rubra和A. filiculoides,另一个包含A. microphylla、A. caroliniana和A. mexicana。特别是,这些资源将有助于区分A. microphylla、A. caroliniana和A. mexicana之间的差异,这三者均曾在加利福尼亚被记录,且有时被视为同义词。了解加利福尼亚的物种分布对保护规划非常重要,因为这使我们能够区分需要监测和控制的潜在入侵物种与值得保护的稀有本土物种,这些物种迄今尚未被明确识别。一旦分类问题得到解决,我们可以开始建立条形码协议,以提供识别资源。
这些基因组资源还将为形态学和微生物组数据集的整合奠定基础,从而在加利福尼亚及其他地区绘制满江红多样性的广泛多层次图景。此外,这一染色体水平的基因组将是蕨类比较基因组学的重要资源,该领域仍处于起步阶段,目前仅发表了少数几种蕨类的染色体水平组装:Marsilea vestita、Ceratopteris richardii、Alsophila spinulosa和Adiantum capillus-veneris。作为CCGP中唯一的蕨类,这些基因组资源将为与其姐妹类群种子植物的景观基因组学研究所获得的见解提供有益的比较。
附图1 美洲满江红基因组组装质量
附图2 美洲满江红和细叶满江红基因组比较
Citation Tools
The genome assembly of the duckweed fern, Azolla caroliniana
Michael J. Song, Fay-Wei Li, Forrest Freund, Merly Escalona, Erin Toffelmier, Courtney Miller, H. Bradley Shaffer, Oanh Nguyen, Mohan P.A. Marimuthu, Noravit Chumchim, Carrie Tribble, Colin W. Fairbairn, William Seligmann, Carl J. Rothfels
bioRxiv 2024.10.22.619683;
doi: https://doi.org/10.1101/2024.10.22.619683