小麦的野生近缘植物(WWRs)是提高小麦应对胁迫能力的重要资源之一。小伞山羊草(Aegilops umbellulata Zhuk.)是其中一种二倍体(2n = 2x = 14)WWR,具有与其他小麦族物种基因组相似的庞大且重复的U基因组。由于小伞山羊草具有较高的遗传多样性和对多种生物及非生物胁迫的耐受性,研究者们已多次努力将包括抗胁迫性状和改良的烘焙品质在内的重要的农业性状引入栽培小麦中。其中,已定位包括Lr9、Lr76(抗叶锈病)、Yr70(抗条锈病)和PmY39(抗白粉病)等抗病基因。尽管小伞山羊草在改良小麦方面具有巨大潜力,但其基因组资源尚未得到充分建立,染色体重排及其进化轨迹尚未完全阐明,无法有效研究和利用其中新的性状/基因。
2024年9月18日,北达科他州立大学Jatinder Singh等联合多个课题组在国际知名植物学期刊Plant Biotechnology Journal发表了题为“Genomes of Aegilops umbellulata provide new insights into unique structural variations and genetic diversity in the U-genome for wheat improvement”的文章。本研究中,作者对小伞山羊草的基因组进行了全面的研究,分析了U基因组的结构变异和进化。作者首先选择对多种小麦病害具有抗性的“PI 554389”系作为研究对象,构建了高质量的端到端染色体水平基因组组装,并对额外的20个具有地理和表型差异的小伞山羊草基因组进行了重测序。为了解该物种的遗传多样性,作者发现这些样本对多种小麦病害(包括叶锈病、条锈病、杆锈病、褐斑病和细菌性叶条斑病(BLS))表现出不同的抗性水平。作者研究分析揭示了复杂的染色体重排,尤其是4U和6U染色体,显示了小伞山羊草与小麦及其近缘植物的独特进化轨迹。此外,作者利用数据纠正了过去对4U和6U染色体命名的错误,并揭示了多个主要进化事件导致形成现今的U基因组。对不同小伞山羊草种质的重测序揭示了物种内部的高度遗传多样性,共分为三个不同的进化亚群,且抗病表型表现出对五种主要小麦病害不同病程/致病型的广泛抗性变异。抗病性鉴定显示,在重测序的品系中存在多个新的抗病基因,有待于未来的研究。此外,重测序还识别出了从小伞山羊草中克隆的唯一抗病基因Lr9的六种新单倍型。本研究中提供的广泛基因组和表型资源将加速未来对小伞山羊草的遗传探索,推动小麦抗逆性的改良和生产力的提高。
作者使用 小伞山羊草 ‘PI 554389’ 系进行端到端(T2T)染色体级基因组组装(图1a)。共计4.28 Gb的小伞山羊草 基因组组装完成,初级contig组装包含1389个contig,其N50值为8.79 Mb,L50值为141。通过Hi-C将这些contig组装成7个拟分子,覆盖了4.20 Gb的基因组,N50值为634.10 Mb。进一步使用PacBio和超长的Nanopore读取数据填补了7个拟分子中的252个缺口。根据其与IWGSC RefSeq_v2.1 D亚基因组的同源性,对拟分子进行了定向和染色体命名(图1b)。在这7条染色体中,有4条染色体(4U, 5U, 6U, 7U)在两端均发现了端粒,剩下的3条染色体(1U, 2U, 3U)仅在一端发现端粒。染色体大小范围从488.85 Mb(1U)到658.84 Mb(6U),GC含量范围从46.91%(7U)到47.3%(6U)(图1b)。使用BUSCO评估基因组完整性,结果表明超过98%的单拷贝保守直系同源基因被鉴定为完整,其中少于5%的基因为重复基因,符合二倍体物种的预期。
作者使用PacBio iso-seq单分子实时(SMRT)测序技术生成了全长转录本数据,收集了来自4种不同组织(幼苗芽、幼苗根、经春化处理的叶片和未成熟的穗)的RNA样品,并作为基因注释的主要证据。共注释了78,076个基因模型,其中48,366个为高置信度(HC)基因(图1b)。在这些高置信度基因中,预测到2,162个为抗性基因类似物(RGAs),包括790个核苷酸结合域亮氨酸富集重复(NLR)基因、1,094个受体样激酶、160个跨膜卷曲螺旋蛋白以及117个受体样蛋白。
转座子(TEs)占据了真核生物基因组的大部分,并在基因组进化中起到了重要作用。在PI 554389 基因组中,鉴定出了1.24百万个TEs副本,这些副本在与小麦的A、B和D基因组的比较中出现在非同源位置上,占据了U基因组的3.6 Gb(84.1%)。尽管TE几乎完全更新,但每个超家族的比例与A-B-D亚基因组中观察到的类似。在家族层面,只有5%的TE家族(15/300个家族)在U基因组中比A、B或D基因组富集或减少。这些都是低拷贝数的家族,研究中并未观察到特定家族的大量爆发。总体而言,尽管95%的TE家族并不出现在同源位置上,但它们的拷贝数量在U-A-B-D谱系中是相似的。TE的更新并未伴随着谱系特异性的TE爆发或丧失。一般来说,TE家族倾向于保持相对恒定的拷贝数量,U基因组是又一个遵循这种平衡进化模式的例子。
比较基因组分析是一种强大的工具,用于解剖物种的基因组结构和进化历史。通过使用来自11个禾本科物种和一个外群物种的多拷贝直系同源基因进行的系统树分析,揭示了属于A、B和D谱系的三个分支,其中小伞山羊草在系统发育上被归入D谱系(图2a)。在D谱系物种中,小伞山羊草 (U基因组) 最早分化出来,随后D基因组和S基因组物种从共同的祖先分离。在这次进化分离过程中,U基因组积累了主要的染色体重排,这导致了U基因组更广泛的遗传多样性,从小伞山羊草的形态和遗传变异中可以看出这一点。
为了进一步理解这些结构变异,作者进行了U基因组在D谱系物种和非D谱系物种中的全基因组比较分析,包括拟斯卑尔脱山羊草 (Ae. speltoides)、乌拉尔图小麦(T. urartu)、小麦A-B-D亚基因组以及系统发育上较远的物种如大麦 (H. vulgare) 和二穗短柄草(B. distachyon)。作者观察到研究物种相对于U基因组的高水平染色体差异(图2b)。为了研究这些结构变异及U基因组与A、B和D谱系的进化关系,作者对小伞山羊草和乌拉尔图小麦、拟斯卑尔脱山羊草、节节麦(Ae. tauschii) 、沙融山羊草 (Ae. sharonensis) 和高大山羊草 (Ae. longissima) 进行了宏观同线性分析。作者的结果揭示了U基因组特有的主要染色体重排,包括在4U和6U染色体上的几次显著的非互惠易位(图2c)。基于节节麦、小伞山羊草 和高大山羊草之间的同线性分析,作者发现了一个独特的7Sl/4Sl易位(图2c)。这一易位此前仅在高大山羊草中报道过,但在其他S和D基因组物种中不存在。作者还观察到了小伞山羊草中5U/6U的互惠易位,而在其他物种中(除乌拉尔图小麦外)并未发现这种易位。除了易位外,还检测到了7U和2U染色体上的两次主要染色体内倒位以及多个染色体间倒位易位(图2c)。相比之下,1、3和5组染色体在U、A、B、D和S基因组之间表现出显著的保守性。所有这些结构变异共同导致了小伞山羊草U基因组相较于其他禾本科物种形成了独特的基因组结构。
作者观察到在4U和6U染色体上发生了显著的染色体重排。因此,进一步详细检查了4U和6U染色体的同线性,比较了两个D谱系物种,即节节麦 和高大山羊草(图3a)。此前已知的高大山羊草中的7Sl/4Sl易位促使作者研究了S谱系基因组及其与D谱系基因组的关系。结果表明,4U染色体上存在祖先染色体1L(长臂)、2L、7L和6S(短臂)的片段,而6U染色体上则存在5L和4L的片段(图3a)。基于这些发现,作者提出了一个模型来解释4U和6U染色体的进化过程(图3b, c)。同线性分析表明,祖先6S染色体的一个重要部分(~120 Mb)可能与4S染色体融合。在随后的非互惠染色体间易位事件中,祖先染色体7L(约55 Mb)、2L(约34 Mb)和1L(约55 Mb)的远端片段逆向融合到小伞山羊草的4号染色体上,形成了现代小伞山羊草的4U染色体(图3b)。同样,6U染色体可能是通过祖先4L染色体的一部分区域(~210 Mb)的非互惠易位演化而来的,并且此时6U染色体的6S部分被转移到了4号染色体上(图3c)。之后,转移到6U染色体上的4L片段部分与5U染色体发生了互惠易位,交换了约35 Mb的区域。这些事件表明,4U和6U的进化是通过独立的连续易位事件发生的,而不是一次性的大规模易位事件。除了这些主要的易位事件外,在4U和6U染色体的进化过程中还发生了多次染色体内的重排。
为了调查小伞山羊草的遗传多样性,作者选择了代表广泛地理分布的20个样本,这些样本在形态和对五种小麦病害(叶锈病、条锈病、杆锈病、褐斑病和细菌性条斑病)的抗性上显示出高度变异性,进行全基因组重测序(图4a, b)。在约10倍覆盖率下进行基因组测序,并使用GATK(v.4.1.8.0)进行变异检测,共鉴定出86,931,487个单核苷酸多态性(SNP)。经过严格的SNP过滤,保留了总计7,184,562个SNP用于进一步分析。
使用过滤后的SNP集进行的主成分分析(PCA)将20个样本分为三个子组(图4c)。其中15个样本归属于组I,组II和组III分别有三个和两个样本。大多数从土耳其采集的样本以及所有来自其他地区的样本都属于组I,除了来自塞尔维亚的样本(组II)和英国的样本(组III)。组I中的样本对各种叶锈病小种的抗性较高,而组II和组III中的样本对多种叶锈病小种表现出易感性(图4c)。PCA结果通过最大似然法估算基因型分组和祖先系数(使用交叉熵值)进一步确认,揭示了三个子组(K=3)(图4d, f)。对20个样本以及每个子组进行的核苷酸多样性分析表明,组III的遗传多样性最大(π=0.00035),组I的遗传多样性最小(π=0.0001)(图4g)。此外,成对核苷酸多样性分析表明,每条染色体上的1 Mb滑动窗口内的核苷酸多样性存在变异,正如预期的那样,着丝粒区域周围的多样性相对较低,而染色体末端附近的多样性较高。
为了确定20个小伞山羊草样本中Lr9和其他抗叶锈病基因的存在情况,进行了表型和基因型评估。PI 554389和另外七个样本对10个叶锈病小种表现出高度抗性,包括对Lr9具有毒性的两个小种(MNPSD和TNBJS)(图4a),这表明这些样本中存在Lr9和/或新的叶锈病抗性基因。PI 554282和PI 542375这两个样本对除TNBJS和TBBGS外的所有叶锈病小种均表现出抗性,表明这两个样本中可能存在两个或更多新的Lr基因。仅有一个样本(48114)的反应模式与Lr9相似,而其他样本则表现出五种独特的反应模式,表明小伞山羊草中除了Lr9之外可能还存在其他尚未鉴定的Lr基因。
由于Lr9基因已被克隆,作者在20个重测序样本中搜索了Lr9等位基因。PI 554389等10个样本中存在完整的Lr9基因。基于克隆的Lr9基因的氨基酸序列变异,作者将Lr9等位基因分为六种单倍型(图5)。其余未覆盖完整Lr9基因的样本也进行了分析。Lr9单倍型分析表明,所有六种单倍型中的蛋白激酶I(PK-I)结构域高度保守。相比之下,蛋白激酶2(PK-II)、Von Willebrand factor type A (vWA)和vWaint结构域中检测到了若干氨基酸替换(图5)。在所有六种单倍型中,与克隆的Lr9相比,PK-II结构域中发现了由亮氨酸到脯氨酸的单一氨基酸替换(L642P)(图5)。这可能是在将Lr9导入六倍体小麦品种‘撒切尔’之前,在原始Lr9来源(TA1851)中发生的自然突变。L642P替换定义了单倍型I(Hap-I),该单倍型存在于三个样本中,即48114、48646和PI 554395。10种叶锈病小种的表型毒性模式也支持了Lr9功能性等位基因在48114中的存在,因为该样本仅对Lr9毒性小种MNPSD和TNBJS表现出易感性。因此,尽管存在单一氨基酸替换,Hap-I仍是Lr9的功能性等位基因。相比之下,携带Hap-I的其他两个样本(48646和PI 554395)对所有测试的叶锈病小种均表现出抗性,包括Lr9毒性小种MNPSD和TNBJS,表明这些样本中除了Lr9之外可能还存在新的叶锈病抗性基因。Hap-II(由PI 542369代表)具有与上述L642P替换一起的苏氨酸插入(S21_S22insT)(图5)。PI 542369对叶锈病的反应与48114相似,但对MHDSB小种表现出额外的易感性,这表明Hap-II也可能是Lr9的功能性等位基因,但在毒性模式中存在轻微差异。Hap-III、Hap-IV、Hap-V和Hap-VI主要在PK-II、PK-II与vWA、或PK-II、vWA与vWaint结构域中存在氨基酸替换。携带Hap-III(PI 554389)、Hap-IV(110746)、Hap-V(PI 298905)和Hap-VI(PI 573515)的样本对所有测试的叶锈病小种均表现出完全抗性,包括对Lr9具有毒性的小种MNPSD和TNBJS。这些样本可能拥有Lr9的功能性等位基因以及其他未知的Lr基因。作者还鉴定了两个样本(PI 554417和AE 1595),它们具有完整的Lr9基因,但在PK-I结构域之前存在早期终止密码子。PI 554417对所有测试的小种表现出高度易感性,而AE 1595对10个小种中的4个表现出中等反应,包括对Lr9毒性小种的反应,表明这两个样本中不存在功能性Lr9等位基因。
总结:山羊草属(Aegilops)长期以来被广泛研究,以挖掘其有助于小麦改良的有益性状。小伞山羊草是其中一种携带丰富多样性的野生小麦近缘种(WWRs),在应对多种生物和非生物胁迫方面表现出很强的抗性。本研究揭示了U基因组在数百万年间的主要进化变化,导致了该物种丰富的遗传多样性。作者开发的基因组资源为未来利用新性状,构建具有更强抗生物和非生物胁迫性的麦类作物品种提供了机遇。本研究中揭示的在小伞山羊草中发生的复杂染色体重排为研究小麦三级基因库物种的进化开辟了新的途径。