SNP基因分型
由于基因组大小大、倍性特性、基因重复、编码区内序列差异低以及探针/引物退火位点的突变,SNP基因分型在小麦中变得复杂。相反,SNP的丰富性、高度多态性、跨平台的易转移性以及50%到97%的成功转换率使其成为小麦基因分型的流行标记系统。在NGS时代之前,SNP基因分型基于一些低通量的凝胶检测方法,如CAPS标记。然而,通过NGS管道发现的数百万个SNP需要高通量基因分型检测方法。SNP芯片和基于NGS的基因分型检测方法(如GBS)已成为当前小麦育种计划中必不可少的基因分型平台,在这些计划中,需要许多全基因组标记来构建高分辨率的遗传图谱、QTL定位、GWAS和基因组选择。一旦确定了显著的标记-性状关联,单重基因分型检测方法如KASP在MAS程序中起着重要作用,其中紧密连锁的标记被专门选择用于将性状导入优良遗传背景。
SNP芯片
除了大规模SNP发现之外,SNP标记在小麦改良中的日益增加的使用归因于开发高通量SNP基因分型芯片的快速进展。除了具有成本效益的性质外,阵列还可以定制设计用于靶向基因组特定区域或基因的SNP。对于小麦等多倍体,基于Affyssin和Illumina的技术是开发SNP芯片的两个广泛使用的平台。虽然这两种系统都是基于寡核苷酸探针和基于杂交捕获与靶向SNP相关的DNA片段,但它们随探针长度而变化:Affytek为25-mer,Illumina为50-mer。使用这些平台,已经开发了一系列SNP芯片,目前用于小麦改良,包括对锈病的抗性。
小麦9K Illumina iSelect SNP芯片
9K SNP芯片于2013年开发,是首批为小麦开发的高密度基因分型芯片之一。该芯片由来自三个不同来源的9000个SNP组成,从9个栽培小麦种质的参考转录本中鉴定的SNP、从一组20个地方品种中鉴定的SNP和从SynOp作图群体的亲本中鉴定的基因SNP。通过对2994个六倍体小麦种质的不同小组进行基因分型来验证该芯片,并且使用六个双亲作图群体和MAGIC群体构建包括7504个基因座的共有遗传图谱。通过鉴定高密度品种间SNPs证明了该芯片的实用性,评估种群结构和遗传多样性,产量相关性状的QTL定位、关联分析和基因组选择和抗病性。在抗锈性的情况下,使用9 K芯片来定位Lr 67、Lr 74、Lr.ace-4A、Sr 7a、Sr 12、Sr 25、Sr 56、Yr 5、Yr 78和Yr 82抗锈性基因。此外,广泛使用的多效和三重锈病抗性基因,Lr 34/Sr 57/Yr 18也使用9 K芯片定位。此外,该芯片能够检测7A中所有阶段茎锈病抗性的新QTL以及6D和7A染色体中成株抗性的新QTL。
Illumina 90K iSelect芯片
iSelect90K芯片是一个定制设计的芯片,包含81587个功能性SNP,这些SNP是通过对19个普通小麦和18个硬粒小麦样本进行转录组研究发现的。该芯片通过对八个双单倍体(DH)作图群体进行基因分型,绘制了46977个功能性SNP。此外,该芯片还用于包括550个六倍体和55个四倍体小麦样本(包括不同地理来源的地方品种和栽培品种)在内的多样性研究。使用90K iSelect芯片对Lr16、Lr33、Lr 2K38、Lr48、Lr64、Lr74、Lr77、Lr79、Lr80、Lr82、Sr5、Sr8a/Sr8155B1、Sr883-2B、Sr9h、Sr11、Sr12、Sr13、Sr14、Sr15、Sr16、Sr22、Sr26、Sr42、Sr60、Sr63、SrKN、Yr29、Yr66、Yr67和Yr71锈病抗性基因进行了作图。
小麦15K SNP芯片
小麦15K SNP芯片包含13,261个SNP,这些SNP是基于超过2000个基因型(包括欧洲和全球的小麦品系)的基因型数据从90K芯片中衍生出来的。随后,该芯片使用204个冬季面包小麦品种和关联作图分析进行了验证。这种成本效益高的15K SNP芯片被用于在Ae. tauschii中作图Lr21位点。
Axiom® HD小麦基因分型(820 K)芯片
9K、15K和90K芯片中的SNP不足以预测次级和三级基因库中的等位基因多样性。因此,引入了Axiom® HD小麦基因分型(820K)芯片,通过对43个小麦样本和属于二倍体、四倍体、六倍体和十倍体物种的野生亲缘种进行外显子捕获,识别出819,571个SNP,以克服这一限制。该芯片通过对代表A、B和D基因组的475个样本和三个作图群体的个体进行基因分型进行了验证。大约289859个SNP通过细胞遗传学材料进行了物理定位,56505个标记通过三个作图群体的共识图谱进行了遗传定位,图谱长度为3739 cM。该芯片进一步验证了其在分析群体结构和多样性以及检测和作图新引入的小麦染色体上的效用。然而,由于大多数标记来自小麦亲缘种,源自基因的编码区,仅代表小麦基因组的一小部分,并且不适合成本效益高的基因分型,因此该芯片在六倍体小麦育种计划中的应用有限。Axiom® HD小麦基因分型(820K)芯片用于作图叶锈病抗性基因Lr32。
Wheat Breeders的35K Axiom芯片
为了具有成本效益的高通量基因分型平台,从820K芯片中选择了35143个SNP标记的子集,基于它们在基因组中的均匀分布和高水平的多态性,设计了小麦育种者的35K Axiom芯片。通过对五个作图群体进行基因分型,62.6%的这些SNP被遗传定位。此外,通过筛选包括来自Gediflux和Watkins全球地方品种收集、缺体和单体细胞遗传学储存材料在内的1,779份六倍体材料的独特和精英收集,该芯片展示了其在六倍体小麦中的高密度遗传作图、多样性和基因组重排中的实用性(Allen等,2017)。利用35K Axiom芯片对LrTs276-2、LrM、SrH、SrY和Yr29/Lr46等抗锈基因的基因组区域以及新的QTL(QYrcw.nwafu.3BS)进行了作图。
Axiom®小麦660 K SNP芯片
Axiom®小麦660K SNP芯片由中国农业科学院(CAAS)设计。从通过GBS(78个样本)、RNAseq(32个样本)和不同小麦基因组的重测序数据生成的5100万个基因组特异性SNP中,最初设计了四个623K芯片,并使用192个小麦样本进行了筛选。然后使用高度多态性的SNP生成了用于商业目的的高密度Axiom®小麦660K SNP芯片。该芯片能够检测100,000个基因(几乎所有小麦基因),并且78%的SNP被遗传定位,使660K芯片成为多样性、单倍型分析和研究小麦农艺性状遗传基础的潜在基因分型平台。使用660K SNP芯片对全阶段抗性QTL QYrXN3517-2BL进行了作图。但与Axiom® HD小麦基因分型(820K)类似,使用660K SNP芯片并不是一种具有成本效益的方法。
小麦55 K SNP芯片
小麦55K SNP芯片包含53,063个标记,这些标记源自660K SNP芯片,并与重要的农艺性状相关。该芯片由中国农业科学院(CAAS)和Affymetrix联合设计。通过55K SNP芯片,基因分型成本降低到660K SNP芯片的三分之一,其在构建高密度遗传图谱和QTL作图中的实用性得到了验证。该芯片还用于作图Yr30/Sr2和新的QTL,包括QLr.hebau-5AL/QYr.hebau-5AL、QLr.hebau-3BL、QYr.hebau-5AL、QYr.hebau-4BS、QYr.hebau-6BS、QYr.nwafu-7BL、QYr.gaas.2A和QYr.gaas.6A。
18K闪存AxiomTM 384布局芯片
由Affymetrix合成的18K AxiomTM 384布局芯片包含18101个SNP,这些SNP来自于在法国协作育种小麦项目下开发的高密度420K Axiom芯片。该芯片的独特之处在于,仅选择了覆盖整个基因组的可重复和共显性SNP,这些SNP是基于对来自不同地理区域的200个小麦样本的表征而选择的。通过对从澳大利亚小麦种质中开发的九个双单倍体(DH)群体进行基因分型,展示了该芯片在生成共识连锁图谱中的实用性。
TaBW280K芯片阵列
先前描述的芯片主要包括从转录组、外显子组和GBS中发现的SNP。TaBW280K芯片是使用通过小麦全基因组测序(WGS)识别的三百万个SNP中的一个小子集(280226个SNP)设计的。这是一个高通量基因分型芯片,包括225596个基因间SNP和54280个基因SNP。该芯片已被用于构建一个高密度的遗传连锁图谱,包括83721个标记,覆盖长度为3308 cM。
小麦50K(TriticumTraitBreed)芯片
最近,Rasheed和Xia(2019)报道了一个定制的小麦50K芯片(TriticumTraitBreed芯片),该芯片基于从小麦35K、90K和660K SNP芯片中选择的高质量SNP。该芯片包含大约135个功能性标记和700个与已知QTL紧密连锁的SNP。
10K Ae. Tauschii SNP芯片
10K Ae. tauschiiInfinium SNP芯片是一个物种特异性芯片,通过从在Ae. tauschii样本AL8/78和AS75之间识别的近200,000个SNP中选择10,000个SNP开发而成,其中9,485个来自功能性检测。少部分SNP(515个SNP)位于小麦EST中,并已分配到AL8/78 × AS75遗传图谱的连锁群上。使用这种D基因组特异性芯片对Ae. tauschii的锈病抗性基因Lr42和YrAs2388进行了表征。
Illumina Infinium 小麦大麦 40K SNP 芯片
最近开发的小麦大麦40K SNP芯片是一个多物种芯片,旨在实现高精度的SNP基因分型。它分别包含14261个和25363个与关键农艺性状相关的大麦和小麦SNP标记。小麦的SNP标记基于对1041个面包小麦样本的外显子测序,而大麦的SNP标记则基于对267个样本的外显子测序和来自Intergrain商业大麦育种计划的117个样本的全基因组测序。由于它允许在单个芯片上进行多个样本的杂交,小麦大麦40K SNP芯片作为一种通用且具有成本效益的基因分型平台,广泛应用于全基因组关联研究和基因组选择。鉴于芯片种类繁多,育种者必须根据所使用的种质资源和所需的遗传分析性质做出谨慎选择。此外,基于芯片的SNP标记引入了确定性偏差,这可能会低估多样性和基因组预测能力。
Triticum aestivum 下一代(TaNG)芯片
最近开发的TaNG芯片包含43,372个SNP标记,这些标记来源于204个优质小麦品系和111个Watkins小麦地方品种的全基因组序列。这些SNP是基于区分品种的能力和转换为明确标记的能力而选择的。
基于下一代测序(NGS)的SNP基因分型系统
在基于NGS的基因分型系统中,涉及单酶和双酶策略的GBS特别有成效,尤其是在识别与锈病抗性相关的新基因座方面。通过详尽的QTL作图和全基因组关联研究,它为通过MAS快速选择锈病抗性铺平了道路。目标GBS(tGBS)旨在定位和饱和特定基因组区域,是GBS的扩展创新,能够有效地表征大量样本中的数千个标记。tGBS方法已被用于作图全阶段条锈抗性基因YrAw12、YrPAK和成年植物条锈抗性基因Yr75。
与SNP芯片相比,GBS引入的确定性偏差较少,在预测稀有等位基因方面更可靠,从而能够揭示基因库中的分子多样性。此外,它不需要先前的序列信息或目标探针集。然而,它涉及复杂的两步文库制备,包括限制性内切酶消化和接头连接。这一限制已通过简化的NGS文库制备方案克服,该方案使用转座子复合物在一步中实现DNA片段化和接头连接。通过对这些文库进行低深度(1-2x)测序,可以实现不同水平的全基因组覆盖,这被称为Skim测序。Skim-Seq方法作为基因分型平台和基因组辅助育种工具的实用性已在小麦的DH群体和细胞遗传学材料中得到验证。
尽管GBS方法非常稳健,但在这些多重平台中检测到的SNP中有相当一部分(18-33%)由于缺失数据、次要等位基因频率、弱扩增、杂合子调用的模糊性以及调查面板中的多态性缺乏等因素而被丢弃。此外,每个样本的高成本和大量时间限制了这些基于NGS的SNP基因分型平台的应用,特别是在需要筛选样本较少且标记密度相对较低到中等的情况下。在这种情况下,单重SNP基因分型平台被认为是高效且经济的。