研究背景
遗传抗性是作物病害防治中最为经济和环境可持续的方法。来自野生近缘物种的抗病基因是培育抗病品种的宝贵资源。然而,R基因在作物中的渗入是一个漫长的过程,且通常与不利连锁基因相伴。当单独部署R基因时,病原体可以迅速进化以克服R基因。将多个已克隆的R基因以堆叠的方式导入作物中,可以避免连锁累赘和延迟克服抗性病原菌小种的出现。然而,目前的R基因克隆方法需要分离或突变后代,许多野生近缘种由于农艺性状而难以满足上述要求。作者利用一个野生二倍体小麦的自然泛基因组变异,结合关联遗传和R基因富集测序( AgRenSeq ),在6个月内克隆了4个抗秆锈病基因。因此,RenSeq结合多样性panel是分离作物广谱抗性R基因工程的一大进步。
植物的抗病性往往是由显性或半显性的R基因介导的,这些基因编码的受体感知病原物的侵染,或通过直接识别病原物效应因子,或通过识别效应物修饰的寄主靶标间接实现。大多数已知的R基因编码细胞内核苷酸结合/富含亮氨酸重复序列( NLR )免疫受体蛋白。NLR基因是植物中进化最活跃的基因家族之一,在植物基因组中通常存在数百个NLR基因。作物及其野生祖先在这些NLR位点具有广泛的拷贝数和序列变异。驯化和单一育种降低了作物中R基因的多样性,使其更容易受到疾病流行的影响。来源于近缘物种的新R基因已经通过漫长而艰苦的渐渗育种或利用转基因被引入到作物中以提高抗病性。
引入的外源R基因在NLR位点存在广泛的泛基因组变异,使得参考基因组序列与其他材料之间难以建立正交关系。不同种质NLR位点的结构变异也可以减少位点的重组,进一步使定位克隆方法复杂化。基因克隆对重组的要求可以通过突变基因组学来克服。通过诱变、降低基因组复杂性和测序(NLR外显子捕获MutRenSeq、染色体流式分选和测序MutChromSeq)产生多个独立的突变体,可以无歧义地鉴定突变等位基因和功能NLR基因。
定位克隆和突变基因组学具有一定的局限性。值得注意的是,它们要求R基因以单个基因的形式存在于对病原体及分离物敏感的遗传背景中,而这需要经过许多代才能实现。除此以外还要求目标物种适合于产生和筛选数量为1000+个体的大型重组或突变群体(表1)。然而,许多作物的野生近缘种含有多个功能抗性基因,由于世代时间长、种子质量不佳、种子休眠等驯化前性状,以及种子和植株形态不符合现有机械化技术,试验上难以处理。
相反,全基因组关联分析( genome-wide association studies,GWAS )不需要单基因抗病品系、定位或诱变群体的开发。GWAS通过利用自然群体中积累的重组事件,在遗传多样性的群体结构中实现性状关联。利用全基因组范围内的一组标记对群体内的成员进行筛选,并在标记和感兴趣的性状之间寻找连锁不平衡。然后,与兴趣性状相关联的标记很容易被分配到参考基因组中的区域。然而,对参考基因组的依赖使鉴定显著偏离参考序列的基因变得复杂,R基因位点通常也是如此。最近,通过对病例和对照样本之间不同的子序列( k-mers )进行性状关联来识别与人类疾病或细菌抗生素耐药性相关的变异,克服了这一局限性。作者推断,基于k-mer的关联遗传结合抗性基因富集测序( AgRenSeq )将有助于从植物多样性面板中发现和克隆R基因。
本研究描述了一组以小麦秆锈病为表型的AgRenSeq分析。节节麦( Ae. tauschii )是普通小麦( Triticum aestivum,面包小麦) D基因组的野生祖先种,也是面包小麦抗秆锈病基因的宝贵来源。为了测试AgRenSeq,选择了具有遗传多样性的节节麦和从该物种中克隆的2个Sr基因(Sr33和Sr45)作为阳性对照。并以跨越其生长范围的节节麦174份,包括21份作为外类群的节节麦为材料。
研究内容
作者设计并测试了一个针对节节麦NLRs优化的序列捕获诱饵文库,基因组区域编码317个单核苷酸多态性( SNP )标记,分布于所有7条染色体。利用该捕获文库和Illumina shortread测序在多样性面板上进行RenSeq分析,平均每个accession获得1.67 Gb的250 bp双端序列数据。使用NLR parser对denovo数据进行分析,该程序根据短保守NLR序列的motifs数量和顺序来识别NLR。获得了1312至2170个(平均1437 ) NLR连续克隆系,其中249至336个(平均299个)编码NLR 1024至1921个。对获得的SNP标记序列进行了种质间的比较,筛选出151份遗传差异显著的节节麦种质(图2a)。利用这些材料与7个具有不同毒力谱和地理来源的PGT小种进行了表型鉴定。根据使用的PGT小种,10 %到67 %的材料表现出抗性。
为了鉴定表型panel中的抗秆锈病基因,进行了基于k-mer的AgRenSeq分析。k-mer序列根据其发生时观察到的抗病或感病水平给出一个数值,然后将这些值汇总为单个k-mer。在之前基于k-mer的GWAS中,关联的k-mer被用来构建一个assembly或通过直接逐碱基k-mer频率指导的延伸过程重建单倍型。然而,作者认为仅仅使用与性状紧密连锁的k-mers进行局部组装并不能产生完整的NLR重叠群,尤其是在更保守的NB-ARC结构域中。因此,将k-mers直接投射到由抗性种质读段数据生成的NLR组装体上,以获得包括全长NLR在内的长重叠群。
将与RKQQC(一个生理小种)抗性相关的k-mers映射到Sr33来源材料BW _ 01189的RenSeq组装体上。在一个5.6 kb的RenSeq重叠群中发现了一个单独的离散关联峰,与Sr33的一致性为100 %。使用相同的方法对151份材料中与对所有剩余6个PGT小种抗性相关的k-mers进行定位。鉴定到除Sr33外的2个非冗余、高可信度的候选Sr基因(图2d-e),并将这些候选Sr基因比对到小麦品种扬麦22的参考基因组中。这些候选Sr基因的基因组位置与从节节麦中导入小麦的两个Sr基因Sr4626和SrTA166227的遗传位置一致。将Sr TA1662候选基因在重组自交系群体中定位到一个3.8 c M的区间,表明该区间编码Sr TA166抗性,从而支持了AgRenSeq数据。SrTA1662候选基因编码一个卷曲螺旋的NLR蛋白,与Sr33的氨基酸一致性为85 %。
虽然Sr33、Sr46和SrTA1662的鉴定是成功的,但是没有鉴定出Sr45。推测这是由于Sr46在群体中的流行掩盖了Sr45的抗性,因为所使用的7个PGT小种中没有一个对Sr46是毒性的,而对Sr45是无毒的。为了克服这个限制,将包含Sr46的所有64份材料从群体中剔除。其余87份材料中与抗PGT小种TTKSK相关的k - mers被定位到抗TTKSK的BW _ 01083 ( Sr455的原始供体)上。前期通过MutRenseq从小麦-节节麦BW _ 01083渐渗系中鉴定了一个候选Sr45基因。利用AgRenSeq鉴定到一个离散的关联峰,与之前鉴定到的Sr45候选基因相对应(图2f )。将该基因转化到Fielder中,证实了之前的MutRenSeq鉴定结果和目前的AgRenSeq数据。通过AgRenSeq分析和序列比对,Sr46和SrTA1662在42 %的种质中最普遍,而Sr33和Sr45分别在5 %和7 %的种质中最普遍。