禾本科盐草T2T基因组组装助力解析雌雄异株,B 染色体和耐盐的秘密

创业   2024-09-05 00:02   云南  
导读:近日,来自沙特阿卜杜拉国王科技大学的Jesse Poland教授,联合美国科研团队,在Nature Springer旗下的预印本平台(投稿期刊为Nature系列期刊,投稿日期为2024年8月22日,目前正处于审稿过程中),上传了题为“Saltgrass genomes reveal unique features of a dioecious, perennial, halophytic grass”的文章。
文章主要聚焦禾本科虎尾草亚科狗牙根族的盐草属Distichlis spp)植物,盐草为雌雄异株(ZW型性别决定)多年生,且具有耐盐碱的优良特性,其可作为生态修复和作物从头驯化的理想材料。考虑到全球气候变化,尤其是气候变暖不断加剧,海平面不断上升,给全球生态安全和食品供应带来了巨大挑战。新形式下,选择能够适应未来气候变化的作物就显得尤为重要,盐草就是一个很好的候选者,其可能具有可以导入现有作物的优异基因资源。但是基因组资源的匮乏,一定程度上阻碍了相关的研究和工作。
因此,Jesse Poland教授与美国团队合作,成功构建了盐草属两个物种的四份染色体水平的基因组(其中一份基因组进行了单倍型分相,一份达到了T2T组装水平)。研究团队利用组装的基因组进行探针设计,并开展比较基因组学分析,发现这两种盐草是异源四倍体,其中一个物种还发生了跨亚基因组的染色体融合。FISH图像证实了此次融合事件,并验证了基因组组装的完整性和准确性,此外还发现盐草存在数目不等的B染色体。盐草基因组和随带开发的探针为盐草功能基因组学研究提供了宝贵的资源。

摘要

对于农业生产而言,气候危机将集中体现在淡水这一关键资源上。了解盐生植物在非淡水条件下生存的机制,将为通过新驯化(neodomestication)技术实现作物高效生产开辟新的道路。盐草(Distichlis spp.)是一个独特的盐生C4光合作用,且为雌雄异株的一个属,属于PACMAD支系。它们生长在潮汐平原和盐沼中,这些环境的盐分通常超过海水,使得盐草成为最耐受盐分的禾本科植物之一。本文对盐草的基因组结构进行了深入研究,揭示了其独特的生物学特性,包括雌雄异株性和盐生生长特性。我们组装了四份盐草高质量端粒到端粒的单倍型基因组,基因组大小范围在569 - 609 Mb之间。结果表明,盐草是异源四倍体,具有两个高度共线但部分分化的亚基因组。将全长基因测序和深度RNA测序数据映射到基因组上,注释了58,590 - 61,079个高度可信的基因,并揭示了这两个亚基因组之间存在大规模基因丢失,每个亚基因组丧失了超过40%的同源基因。通过对基因组的比较,我们发现了一个新的染色体融合事件,该事件发生在不同亚基因组的染色体之间,这将两种盐草物种(D. spicata, 2n=40 和 D. stricta, 2n=38)区分开来,这为研究基因组重排在适应性和物种形成中所发挥的作用提供了新的线索。我们还发现,在两个基因组中存在大小约为7 Mb的B染色体,其特征与其他物种中已测序的B染色体特性一致。通过对不同性别群体的k-mer分析,我们确定了在雌性基因组中存在一个约为8 Mb片段长度的性别决定区域,证实了盐草为ZW型性别决定,并发现了与性别表达相关的58个基因。通过对来自35个不同群体的364份盐草基因组重测序的群体遗传学分析,揭示了与地理分布相对应的遗传分化结构,并明确了D. stricta可作为一个独立物种。这些基因组资源为在盐碱环境中进行盐草的新驯化奠定了基础,并增进了我们对雌雄异株、盐生植物遗传结构的理解。

背景介绍

淡水资源短缺在世界许多地区愈发成为一个令人担忧的问题,因为对这一重要资源一直供不应求。同时,土壤盐碱化也是一个棘手的问题,海平面上升和土地利用模式的变化导致盐水渗入和土壤盐分的积累。在全球许多地区,淡水资源短缺与高蒸腾率的灌溉方式共同加剧了土壤盐碱化。沿海地区由于海水渗透到含水层,面临着额外的复杂局面。

在超过38万种植物中,人类完全驯化的植物不到300种,部分驯化的植物约为2,500种。只有50种作物为全球人口提供了超过95%的热量。尽管近年来全球食物供应逐渐多样化,许多适应当地的作物被高热量的主粮作物所替代,这导致了食品生产和供应的同质化。与日益严重的全球盐碱化问题相关,目前的作物耐盐能力不够,远不足以应对不断增加的盐碱化土壤面积。事实上,仍有一些被忽视和未充分利用的作物,它们具有宝贵的营养价值,并且在生物和非生物胁迫下生存,这些作物的潜在遗传资源尚未被充分开发,可能有助于在气候迅速变化的情况下满足日益增长的需求。除此之外,还有一些野生物种,如盐生植物,具有作为新作物的开发潜力(通过从头驯化),这些新作物可能适应极端(如高盐)环境。由于绝大多数植物基因组研究和育种工作集中在少数物种上,因此可以将更多的关注和资源投入到具有重大潜力的新物种上。

盐草属(Distichlis Raf.)植物具有多年生、耐盐碱、雌雄异株的特性,分布于各种沿海和内陆盐碱生境中。该属有11个物种,广泛分布于北美洲和南美洲地区,此外澳大利亚的也有该属一个物种的分布。盐草(Distichlis spicata (L.) Greene)广泛分布于北美洲和南美洲的沿海和内陆地区,形态多样;该属的其他物种分布范围较狭窄,包括一些局域分布的地方性物种。在某些地区,有两到三个物种同域分布,并能观察到自然杂交现象。由于具有重要的适应性特征,如根部通气组织和盐腺,盐草以其耐受极端盐分的能力而闻名,包括能够在盐分超过海水的沿海和内陆盐沼中生长。因此,盐草占领了大多数植物无法进入的生境,这对这些环境的恢复和保护工作具有重要意义。由于其在这些极端条件下的生存能力和生物量产出潜力,盐草还具有作为盐碱环境下牧草作物的潜在开发价值。

尽管盐草具有重要的生态价值和农业开发潜力,但对其遗传学和基因组学的了解却十分有限。对盐生植物如盐草的研究,通过了解其基因组结构,可以促进从头驯化工作和适应极端盐碱环境的优良品种的开发。这些改良品种在生态恢复、保护工作中可以发挥重要作用,并可能衍生出基于盐水的新型农业生态系统。

在本研究中,我们建立并分析了一套全面的盐草基因组资源,其中包括来自美国不同地区的四份盐草染色体水平单倍型解析的参考基因组组装。我们的研究结果揭示了盐草属内的染色体融合事件,并阐明了物种形成过程及其对不同环境的适应性。此外,我们准确定位了了单倍型基因组中的性别决定区域(SDR),并描述了额外的B染色体。这些发现使盐草成为从头驯化的有力候选者,适合在盐碱环境中种植,同时也为探索植物中的有趣的基因组特征,如性别决定、额外染色体和物种形成,提供了极好的模型。通过本研究,我们对盐草的生物学有了更深入的了解,这对于解决农业中的盐碱胁迫问题和推进植物进化基因组学研究具有潜在的意义。

结果

异源四倍体盐草染色体水平基因组的组装与注释

为了对该物种进行表征,我们基于流式细胞术,调查了四份盐草材料(三份D. spicata材料,2n=40,分别来自美国的西部、东部和中部地区,以及一份来自美国西部内陆地区的D. stricta(Torr.)Rydb.材料,2n=38)。在许多地区,D. spicataD. stricta同域分布,且在形态上难以区分。之前对这两个物种的研究表明,它们尽管形态相似且同域分布,但具有不同的细胞核型;D. spicata为2n=40,而D. stricta为2n=38。我们还在两份D. spicata基因组中观察到了额外的B染色体,并得到了免疫细胞学分析的支持。我们通过整合准确的PacBio长读长测序(HiFi)数据、染色体构象捕获(HiC)和Bionano光学图谱数据,构建了这四份盐草材料的单倍型解析的染色体水平基因组组装。

对于每个基因组,我们生成了高质量的染色体水平的端粒到端粒(T2T)染色体,且几乎没有gap,其中三份D. spicata基因组分别组装得到了了20条染色体,而D. stricta基因体组装得到了19条染色体。我们还在D. spicata的W6-54757-002(7.3 Mb)和2021-KS-Q6(6.8 Mb)这两份材料中组装了额外的B染色体。

图1 盐草基因组组装

基于盐草属物种为四倍体的假设,我们首先通过与近缘的二倍体物种Oropetium thomaeum(2n=20)(同属于虎尾草亚科狗牙根族)的基因组比较分析,鉴定到了直系同源染色体。我们观察到来自四倍体D. spicata的10条染色体与二倍体O. thomaeum的有着2:1的染色体比例。通过对着丝粒的表征,我们根据着丝粒的位置将染色体分为p臂和q臂。然后,我们通过在基因组中鉴定到的独特的SINE元件,将亚基因组拆分,基于相似性聚类分析显示出对应两个不同亚基因组的染色体簇。每个簇包含10条染色体,每个直系同源群中的两条染色体分别属于两个不同的亚基因组。此外,我们对所有四份盐草基因组的两个亚基因组进行了系统发育分析,显示出明显的两个独立分支。因此,我们在异源四倍体盐草基因组中识别并命名了每条染色体。最后,我们利用之前研究中所测序的细胞器基因组,构建了每个基因组的共识质体序列(约250 Kb)和线粒体序列(约600 Kb),并利用残留的非核基因组序列完成了组装。这些完整的组装大小在528至556 Mb之间,与之前的C值报告一致。

在我们的研究中,约50%的盐草基因组由重复元件组成,这一比例与其基因组大小相似的其他物种基因组一致,如高粱(54%)、水稻(45%)和O. thomaeum(43%)。盐草中的重复元件主要包括长末端重复序列(LTR,约29%)、非LTR序列(约0.5%)、末端倒位重复序列(TIR,约10%)、非TIR序列(约7%),其他还包括着丝粒、端粒和其他重复元件。与其他草类基因组一致,LTRs主要分布在近着丝粒区域。其他非LTR转座元件(TE)和DNA转座子沿染色体分布,但在着丝粒区域缺失。对两个亚基因组中TE分布的分析表明,A亚基因组中TE的比例较高,而B亚基因组中包含更多独特的TEs。我们为每个盐草基因组鉴定了一个独特的162 bp着丝粒重复单体(CEN162),并使用CEN162特异性荧光原位杂交探针确认了其在染色体上的中央位置。通过使用CENH3抗体的染色体免疫沉淀测序(ChIP-seq),我们确认了这些着丝粒为功能性着丝粒。我们发现CEN162重复单体以高阶重复序列(HOR)的形式组织起来,而这些HORs表现出随机间隙或非着丝粒岛屿。这种着丝粒结构与最近在拟南芥中的观察结果一致。

我们在每个盐草基因组中均预测了超过60,000个高置信度(BUSCO > 94%到99%,使用数据集:绿色植物)的基因模型(每个亚基因组约30,000个基因模型)及其相应的单倍型。我们成功注释了超过80%的预测基因。我们的分析揭示了盐草与O. thomaeum(2n=20)、水稻(2n=24)和柳枝稷(2n=4x=36)之间的基因组共线性,以及四份盐草基因组之间的强共线性。我们还发现了亚基因组之间也存在显著的共线性,尽管在每个基因组中存在直系同源基因的丢失。

为了进一步验证我们的基因预测结果,我们评估了盐草中基因及外显子/内含子的长度分布,考虑了长度与倍性比,并与O. thomaeum、水稻和柳枝稷的基因组进行了比较(补充图S1.10A至S1.10C)。我们还插值计算了四个基因组中基因大小与基因组大小的平均比值,发现它们落在草本植物家族的典型范围内(补充图S10E)。这些结果强调了盐草基因组与其他近缘草类植物之间基因结构的保守性和一致性。有趣的是,我们观察到BUSCO重复基因较少(重复基因:37%),这符合四倍体物种的预期(补充图S1.10D,补充表S2)。这表明亚基因组内的直系同源基因正在快速丢失,但在个体中仍保留了一个功能拷贝。我们估计了每个基因组中两个亚基因组之间的直系同源基因,分析结果显示,A亚基因组中有58.4%的转录本在B亚基因组中有直系同源基因,而剩余的41.6%为A亚基因组特有。同样,B亚基因组中有58.5%的转录本在A亚基因组中有直系同源基因,剩余的41.5%是B亚基因组独有的。这些发现表明,自多倍化事件以来,盐草亚基因组迅速衰退,伴随着每个亚基因组中广泛的基因丢失。

为了研究通过两个仍不明确的二倍体祖先如何通过杂交产生现在的异源四倍体盐草,我们利用Time Tree 5(http://timetree.org),使用8份先前发表的的盐草质体/线粒体序列。我们确定最早的盐草物种分化发生在大约1500万年前(Ma),这暗示在这一时期可能发生了二倍体祖先之间的杂交事件(补充图S1.11A)。我们通过估算两个亚基因组同源基因对的Ks值重新评估了这一时间节点,估计分化时间大约在1350万年前。值得注意的是,我们的发现与之前的研究高度一致,表明Monanthochloinae亚族(盐草属)的起源时间在1746万至1300万年前,冠群年龄估计为1472万年。Monanthochloinae亚族包括盐草属的11个物种,其祖先主要分布在新北界地区(74%概率)。

染色体融合导致D. strictaD. spicata的物种形成

在盐草的分类学中,D. spicataD. stricta这两个物种由于形态相似和同域分布,常被认为是同一物种。然而,后续研究揭示了染色体数量的差异以及叶绿体DNA序列的遗传分化,并支持将它们作为不同的物种进行分类。为了研究这些盐草属物种的独特细胞核型,我们进行了染色体水平的比对(补充图S1.9E至S1.9G),研究了具有38条与40条染色体的基因组的共线性(补充图S1.7B)。我们的研究发现了D. spicata(2n=4x=40)中的chr8A和chr10B之间的染色体融合事件,导致D. stricta(2n=4x=38)中形成了一条单一染色体。这种融合发生在不同亚基因组的染色体之间,表明融合发生在两个祖先物种杂交之后。我们通过使用寡核苷酸荧光原位杂交(oligo-FISH)的细胞学分析进一步验证了此次染色体融合事件。

图2 盐草亚基因组间的染色体融合事件

在探讨这种融合染色体起源的机制时,我们观察到Chr8A和10B两端之间存在同源区域,其中还包括一个倒位。解释染色体融合的一种模型是,在这个远端区域发生的同源配对和重组,导致形成了一个符合观察到的方向的大型融合染色体。为了保持稳定,这个双着丝粒染色体需要失去或失活一个着丝粒。有趣的是,我们观察到来自祖先染色体(D. spicata中的Chr8A和10B)的两个着丝粒都丢失了,而在D. stricta中的融合染色体中形成了一个新的着丝粒。对这个新着丝粒中CEN162重复序列的分析表明,它主要起源于D. spicata的Chr8A,并伴有来自其他染色体的序列插入。此外,我们观察到D. spicata的Chr10B末端相对于两个染色体之间的融合点发生了倒位易位,其中包括一些带有端粒序列的基因和TEs。在这种同源重组模型下,同一融合染色体的新形成可能更加频繁,对D. stricta的奠基者效应和种群动态具有重要影响。

D. stricta W6-48045-006中,融合后的8A染色体(37.73 Mb)相比于D. spicata W6-48549-006中未融合的8A染色体(18.31 Mb)和10B染色体(21.20 Mb)合并后的总长度39.5 Mb(补充表S3),显示出了一定程度的染色质丢失。此外,融合染色体中注释到的2,783个基因略少于未融合染色体中发现的3,054个基因总数(D. spicata中的8A染色体有1,456个基因,10B染色体有1,598个基因)。直系同源分析显示,D. stricta(W6-48045-006)和D. spicata(W6-48549-006)之间共有36,030个直系同源基因群。在这些直系同源基因群中,有1,937个在D. stricta的融合8A染色体中存在,并分别与D. spicata未融合的8A和10B染色体中的740和835个直系同源基因对齐。有趣的是,融合后的8A染色体额外鉴定出了420个直系同源组,不过它们分布在D. spicata的其他染色体上。我们观察到,融合染色体的GC含量略高于未融合染色体。总体而言,这些观察结果表明,融合染色体具有独特的结构特征,包括遗传位点排列和组织的变化,特别是着丝粒位置的转移以及端粒和亚端粒的交换。

这种融合事件的发生已在少数植物物种中有所记录。众所周知,在人类中,大猩猩的2号和9号染色体的末端融合对应于人类的2号染色体。此外,在蝴蝶中的一些成员中也观察到了融合事件,包括家蚕(Bombyx mori)、庆网蛱蝶(Melitaea cinxia)和红带袖蝶(Heliconius melpomene)。

B染色体的表征

B染色体(Bs),被认为是超数染色体,已在许多动物、植物和真菌物种中发现,其被认为是额外的可有可无的染色体(见综述,ref 36)。在一个种群内,B染色体的存在并不统一,表现出数量和分布的变异性(例如,白云杉[Picea glauca],2n = 24 As + 0–6 Bs;赤狐[Vulpes vulpes],2n = 34 As + 0–8 Bs;黑家鼠[Rattus rattus],2n = 42 + 0–5 Bs)。在一些物种中,B染色体的数量甚至可能超过必需的A染色体数量,如玉米(Zea mays)中2n = 20 + 0–34 Bs(As指代正常染色体,Bs指代超出的额外的B染色体)。与携带基本遗传信息的A染色体不同,B染色体不发挥基本生物功能。然而,最近的研究表明,B染色体存在显著的多态性,B染色体数量的增加与表型变化及潜在的生育能力下降相关(见综述,ref 37,38)。我们在多个盐草种群的多个基因组中发现了异染色质性质的超数染色体的存在(补充表9),这一发现得到了H4K5Ac的免疫实验的证实(补充图S3)。

图3 盐草B染色体分析

我们选择了带有B染色体的两份盐草基因组W6-54757-002 (2n=40+1B) 和2021-KS-Q6 (2n=40+1B,并分别为每个B染色体生成了一个长度为7.3 Mb和6.8 Mb的单个contig(补充表S3)。每个B染色体在推测为近端着丝粒染色体的长臂上都含有端粒序列。研究发现,每个B染色体都富含重复元件,特别是Copia、Gypsy和长散在核元件(LINEs)(图3A;补充图S3.1A)。此外,Gypsy LTR在整个B染色体中占主导地位,这在玉米中也有所体现。我们观察到着丝粒重复元件(CEN162)在B染色体上呈现出非阵列模式的分布,这与在A染色体上观察到的分布模式不同。通过以CEN162为探针的FISH实验证实了这一观察结果,显示在整条染色体上有弥散信号(图1E和3B,补充图S3.2A到S3.2D)。CEN162分布在B染色体起始位置,支持B染色体为近端着丝粒形态。此外,端粒重复序列在距着丝粒远端的位置被观察到,支持了近端着丝粒B染色体的几乎完整的组装。此外,将B染色体与A染色体每Mb的TEs含量进行比较,发现B染色体上的TEs占比明显更高(每Mb为1290.3个重复元件)相比于A染色体(每Mb为943.9个重复元件)。值得注意的是,Gypsy、LINEs、CACTA和Mutator元件在B染色体上特别丰富(图3C;补充图S3.1B)。

由于B染色体携带了大量与A染色体上重复元件高度相似的重复元件,我们的假设是B染色体可能在进化过程中从任意一条A染色体中分离出来。为了验证这一假设,我们进行了B染色体与每条A染色体之间的k-mer(51个碱基)比较。结果显示B染色体与所有A染色体都存在共享k-mer的分布(补充图S3.1C),这表明B染色体可能通过易位、片段化和重排从所有A染色体的复杂混合中起源。这些发现与最近来自玉米B染色体的研究一致,报告指出B染色体是A染色体片段的嵌合组装,没有明显的共线性。

多项研究强调了B染色体驱动在减数分裂前、减数分裂时或减数分裂后期间的发生,这一现象在不同物种中有所不同。此外,除了驱动之外,B染色体的非孟德尔遗传可能还受到有丝分裂和减数分裂不稳定性的影响(见综述,ref 40)。为解决这一问题,我们在W6-54757-002和2021-KS-Q6的B染色体上分别鉴定到了340和323个预测基因。其中,分别有251和268个基因通过BLAST分析,被成功注释(基因注释表)。基因在整个B染色体上分布较少,且大多编码核酸结合蛋白,并参与其代谢过程(图3D;补充图S3.3A到S3.3C)。综合GO分析显示,这些基因在有丝分裂时期染色体凝聚(chromosome condensation)中发挥作用(补充图S3.3D),进一步支持了B染色体基因在驱动有丝分裂周期自我复制中的潜在顺式调控作用。

北美地区的不同盐草基因池在地理上呈现分隔状态

为研究盐草的遗传多样性,以及D. spicata(2n=4x=40)和D. stricta(2n=4x=38)之间的关系,我们对来自北美35个种群的364份盐草材料进行了高覆盖率的全基因组测序(图4A,补充表S8和S9)。总共保留了9,096,342个具有大于1%次等位基因频率(MAF)的高质量单核苷酸多态性(SNPs)和593,217个小插入缺失(INDELs)。

图4 盐草群体结构分析

我们使用主成分分析(PCA)、邻接树和基于模型的聚类对这一数据集进行了广泛的表征。结果显示,D. spicata(n=23)和D. stricta(n=12)种群之间存在明显的分离(图4B至4D,补充图S4.1;3D-PCA)。我们还通过多个基因组的染色体数目计数证实了这种遗传分离,染色体数目分别为2n=40和2n=38,支持了这两个细胞核型的差异(补充图S1.1A至S1.1G,S4.2A至S4.2H)。通过基于模型的聚类(ADMIXTURE)分析(图4E),我们观察到D. spicataD. stricta之间有明显的分离(K=2)。这一结果在比较来自同一州的D. spicataD. stricta地理上邻近的种群时最为明显,这些种群之间的关系比来自全国不同地方的两个D. spicata种群之间的关系还要疏远。

在区分同域分布的D. spicataD. stricta种群后,种群分析显示了美国各个地区盐草的遗传差异(图4A;补充表S9)。K=3的PCA结果和种群结构分析揭示了地理上的种群分布,将D. spicata种群区分为美国东部,中部和西部种群。这表明由于地理隔离,D. spicata内部具有高度的独特性。

我们发现了一个来自堪萨斯州的6份盐草构成了一个独特的簇,这些盐草来源于D. spicata(2n=40)种群(图4B至4D)。这个遗传种群在D. spicataD. stricta之间呈现出中间状态,暗示了这两个物种之间可能发生了杂交或渐渗。这些盐草在STRUCTURE分析中也表现出一致性,进一步支持了D. spicataD. stricta之间的杂交或渐渗。这6份中间状态盐草的细胞遗传学分析显示,它们均有39条染色体,与D. spicataD. stricta的初级杂交种一致(补充图S4.3A至S4.3F)。通过染色体染色验证了这些盐草材料的杂交特性,观察到D. spicata的8A和10B单条染色体,以及D. stricta的单条融合染色体(补充图S4.2I)。一个已知的D. stricta种群大约距离该D. spicata种群35公里,尽管可能存在更近的种群。Harrington曾通过人工授粉杂交获得了D. spicataD. stricta的杂交种,产生了均为2n=39的盐草(补充表S9),其细胞型与此处收集的天然杂交种一致(补充图S4.2J)。然而,目前尚不清楚这些天然杂交种是如何形成的,这需要进一步的研究。

盐草性别决定区域的表征

盐草是一种雌雄异株植物。因此,通过基因组辅助育种推进该物种的从头驯化进程,将依赖于对其性别决定基因系统的详细理解以及用于性别分型种群的高通量基因分型。先前对D. spicata的研究发现雌性中存在一个显性序列标签位点(STS)标记,提示该物种具有ZW型性别决定系统,雌性为杂合性别。为了在盐草基因组中识别这一区域,我们收集了来自美国俄勒冈州桑德湖(Sandlake-OR)的一群经过性别分型的D. spicata材料(25个雌性和25个雄性)。对该种群进行了高覆盖率的测序,并测试了21bp的k-mer在种群中与雌性或雄性之间的关联。

   
图5 性别决定区域(SDR)的定位

我们发现了大量与雌性相关的k-mer,支持了之前对雌性单倍型特异性性别决定区域(SDR)的观察。将这些k-mer映射到雌性个体(W6-48549-006)的单倍型基因组组装中,我们发现98%(843个中的859个)雌性单倍型特异性的k-mer仅映射到Chr.6A的一个单倍型上,位于3-11 Mb区域(Chr6A.h1)(图5A)。为了探索这一独特的雌性特异区域,我们对Chr6A的两个单倍型进行了比较,发现仅在预期的SDR区域内存在碎片化的嵌合比对(图5B)。为了进一步确认该区域的独特性,我们设计了雌性单倍型特异性探针,发现SDR区域的探针密度高于基因组的其他部分(图5C;补充图S5.1)。使用这些探针组进行寡核苷酸荧光原位杂交(oligo-FISH,染色体染色)的细胞遗传学分析表明,该探针在雄性中不存在,而在雌性中则以单拷贝位点的形式存在,在D. spicataD. stricta中均如此(图5D)。这一发现得到了使用寡核苷酸荧光原位杂交(补充图S5.2A和S5.2B)染色体染色实验的支持,这些k-mer在其他雌性盐草材料(W6-54757-002和2021-KS-Q6)的不同基因组中也表现出一致性。

为了识别雌性单倍型上的特定性别决定/关联基因,我们将雌性单倍型特异性k-mer重新映射到雌性单倍型转录本的基因位置。该分析显示,雌性特异性k-mer仅映射到位于3-11 Mb区域的Chr6A上的37个基因(40个转录本),而该区域内共发现了446个基因(图5E;补充表S10)。我们对这些雌性单倍型基因的37个基因进行了同源基因鉴定,结果表明,这些基因中有26个在雄性单倍型中具有对应的同源基因。

接下来,我们对这40个转录本进行了BLASTP分析,比较了NCBI蛋白质参考序列,并使用InterProScan搜索进行了主要功能域的鉴定(补充表S11)。对这些基因的综合生物过程分析(补充图S5.3)显示,这些基因在表观遗传修饰、逆转录转座子和转录因子中可能发挥作用,可能影响整个基因组中性别决定基因的表达。值得注意的是,GNK2功能域与配子形成相关,而Brf1(TFIIIB相关因子1)直接参与调控性别决定基因的转录。其余基因可能通过参与各种生物过程间接影响性别决定,包括应激反应、蛋白质修饰、基因调控和激素信号传导,但这些功能需要进一步确认。

讨论

面对气候变化,农业生存正面临日益严峻的挑战,包括淡水短缺、气温上升和极端天气事件。这种压力随着全球作物生产主要依赖有限的几种作物而进一步加剧。了解作物野生近缘种的遗传特性至关重要,因为这对植物育种和作物改良工作具有重大意义,特别是在新物种的从头驯化方面,这些新物种能够耐受极端非生物胁迫。优先考虑提高气候耐受性、资源利用效率和营养质量的性状对于确保农业的可持续发展至关重要。在这样的工作中,利用野生近缘种的遗传多样性,通过引入并采取保护措施也是关键。盐草因其强大的盐分耐受性,能够在海水和盐沼中生长,甚至在盐度超过海水的生境中也能顽强生存,因此成为现代从头驯化的有力候选物种。我们描述的D. spicata盐草,在盐碱环境中具有很高的饲料生产潜力。其他一些盐草物种,如D. palmeri,已经表现出类似于水稻等作物的优异农业特征。在开发基因组资源以推进现代从头驯化和分子育种的背景下,我们提供了两个盐草物种全面的基因组学资源。这一基因组资源可以促进分子育种,可能会大幅缩短驯化时间。例如,我们的单倍型盐草基因组组装已经帮助定位了性别决定区域(SDR)和一份可能的性别决定相关基因清单。这些发现,加上靶基因的识别,为基因组辅助育种和基因编辑改造和中开发耐盐碱作物铺平了道路。

其他精美的FISH图像赏析

   
   
   
   
   

其他补充图片

   
   

预印本投稿信息    

Cite

Jesse Poland, Kashif Nawaz, Izamar Olivas Orduna et al. Saltgrass genomes reveal unique features of a dioecious, perennial, halophytic grass, 22 August 2024, PREPRINT (Version 1) available at Research Square [https://doi.org/10.21203/rs.3.rs-4844604/v1]

进化随想
生物学的一切都是相比较而言
 最新文章