小麦是世界范围内的主要粮食作物。重要农艺性状的遗传解剖是小麦产量不断提高以满足世界人口增长需求的必要条件。2020年7月20日,由山东农业大学农学院刘树兵团队及其合作者在Molecular Plant上发表了题为“High-Resolution Genome-wide Association Study Identifies Genomic Regions and Candidate Genesfor Important Agronomic Traits in Wheat”的研究论文,该研究说明GWAS群体规模和标记密度的显著增加大大提高了QTL候选基因的检测和鉴定,它大规模QTL精细定位、候选基因验证和开发小麦基因组学育种的功能标记奠定了基础。其主要研究结果如下:
1.基因组变异、LD和种群结构
在所有21条小麦染色体上共鉴定出327609个高质量GBS snp(图1A)。主成分分析和亲缘关系分析也表明没有明显的种群结构(图1B)。主成分分析表明,前两个主成分仅解释了总方差的6.5%和3.4%(图1B),表明关联的群体结构较弱,这可能是由于中国小麦产区之间广泛交换小麦育种材料所致。LD衰减的峰值与4A和7A的遗传多样性和5A的遗传多样性共定位(图1D和1E)。
图1 协会小组中snp的分布、群体结构、LD和遗传多样性。(A)小等位基因频率大于0.01、缺失率80%(左)、缺失率40%(右)的snp分布。(B)邻居树(左上)、主成分(左下)和亲缘关系(右)分析揭示的种群结构。(C)全基因组和A、B、D亚基因组的LD衰减。
2.表型变异和相关性分析
在所有环境中评估的所有性状的表型变异丰富。大部分性状呈正态分布,但各环境品种间差异明显。抽穗期(HD)、株高(PH)、单株穗数(SN)、穗长(SL)、穗粒数(SNS)、穗粒数(GN)、等与籽粒相关的性状(粒长(GL)、粒宽(GW)、粒长宽比(GLWR))在不同环境下的差异较大。PH与HD呈中等正相关(r = 0.33)。SL、SNS、GN三者之间存在正相关关系。GS与GN(r = 0.76)、SNS(r = 0.14)均呈正相关。SC与SL呈负相关(r = - 0.83),与SNS无显著相关。TGW与GW(r = 0.84)和GL(r = 0.62)呈正相关,与GLWR(r = - 0.15)呈负相关。
3.GWAS分析
GWAS在7个环境中检测到12个性状的807个标记-性状关联(mta)(图2)。分位数图显示,GWAS的总体假阳性率得到了适当的控制。每个性状的mta数量从GL的17个到HD的265个不等。超过30%(135个)的qtl在至少两种环境下显著。其中9个qtl在所有测试环境下均显著,其中GN 3个,HD 2个,PH、GS、TGW和GW各1个。395个显著qtl在3个亚基因组中分布不均匀,其中D亚基因组72个,A亚基因组135个,B亚基因组188个。不同亚基因组上的QTL数量随LD块数的增加而增加,表明QTL鉴定的能力受标记密度的影响(表1)。但不同亚基因组间的QTL数量与LD块数之比存在差异,其中B亚基因组的QTL数量与LD块数之比(0.26%)高于a亚基因组(0.22%)和D亚基因组(0.17%),说明QTL在三个亚基因组间的分布并非随机。
图1 基于GWAS的多种环境下所有性状的曼哈顿图。y轴表示不同性状的-log10(p),点的颜色表示不同的环境。HD,抽穗期;PH值,株高;SN,尖峰数;SL,穗长;SNS,每穗小穗数;TGW:千粒重;GL,籽粒长度;GW,籽粒宽度;GLWR,籽粒长宽比
4.有利QTL等位基因的分布及其表型效应
qtl的有利等位基因频率范围为0.01 ~ 0.99,中位数为0.58。总体而言,HD、PH、SN、TGW、GL和GLWR的qtl有利等位基因频率(中位数为0.63 ~ 0.98)远高于SL、SNS、GN、GS、SC和GW的有利等位基因频率(中位数为0.17 ~ 0.36),表明大多数材料具有降低HD、PH、SL、SNS、GN、GS、SC和GW的等位基因,而增加SN、TGW和GL的等位基因(图3A)。
根据每个性状携带的有利等位基因的数量将其进一步分组,观察到各组的平均表型值与每个加入的有利等位基因的数量显著相关(p < 0.01)。GL、GN、GS、GW、SC、SL、SN、SNS和TGW随有利等位基因数量的增加而增加,HD、PH和GLWR随有利等位基因数量的增加而降低。多数性状(SL、GLWR、SC、GL、GN、SNS、SN和PH)的表型值与各加入有利等位基因数的决定系数(r2)均为0.82,说明这些性状主要受加性效应qtl控制。GS、TGW、GW和HD的r2均< 0.65,说明这些性状的qtl表达更容易受到环境的影响(图3B)。
图3 QTL等位基因分布及性状随有利等位基因积累的变异。(A)所鉴定的QTL的等位基因分布,每一行表示一个QTL,每一列表示一个加入。每个性状的qtl按有利等位基因频率由高到低排列。抽穗期提前(HD)、穗数增加(SN)、穗长增加(SL)、穗粒数增加(SNS)、粒数增加(GN)、粒实度增加(GS)、穗密度增加(SC)、千粒重增加(TGW)、粒长增加(GL)、粒宽减少(GW)、株高降低(PH)和粒长宽比减少(GLWR)的等位基因为有利等位基因。括号内的值是所鉴定的qtl的有利等位基因频率的中位数。红色和绿色分别表示有利和不的等位基因。空白表示缺少数据。(B)每个性状携带不同有利等位基因数量的材料的性状表现。x轴表示qtl的数量。
5.GWAS鉴定了已知基因以及qtl的基因组区域
利用IWGSC参考基因组,在qPH4D中发现了一个克隆的降低PH的主要基因Rht-D1。在目前的研究中,AM组中60%的遗传源携带Rht-D1,PH值显著降低。春化基因Vrn-B1显著降低HD,增加SN和GS,表明Vrn-B1对这些性状具有多效性作用。Vrn-D1是Vrn-1在D亚基因组上的同源基因,也与SN显著相关,但与HD或GS不相关。PH有两个qtl, qPH5A1和qPH5A2,在5AL的远端鉴定。
6.4BS和5AL上的提高结实率的新qtl和候选基因
(1)QTL on 4BS 在4BS上28.7 ~ 44.4 Mb的区域中,检测到几个与穗相关性状相关的显著qtl(图4A)。该区域包含Rht-B1是一种导致PH降低的基因;然而,Rht-B1的基因特异性标记与小穗性状没有显著相关,LD也没有与任何显著的snp相关(图4A)。其中两个基因,编码rna结合蛋白34的TraesCS4B02G049100和编码gpn环gtpase样蛋白的TraesCS4B02G049300,在克农9204和中国春的所有阶段都相对高表达(图4C);因此,它们是这三个共定位的4BS QTLs(qSL4B.1/qGN4B.2/qGS4B.2)的候选基因。
(2)QTLs on 5AL 在染色体臂5AL上发现了几个与SN、SL、GN和GS相关的qtl(图5)。
图4 穗相关性状qtl qSL4B.1/qGN4B.2/qGS4B的验证2,在4B染色体上。(A) 4BS上穗长(SL)、穗粒数(SNS)、粒数(GN)qtl的局部曼哈顿图和连锁不平衡(LD)热图。仅显示包含每个QTL峰的LD区内的snp。(B) F2群体及其亲本阳光2号个体的SL、GN、GS和穗紧度(SC)表型数据。5号(YG5)和烟农19号(YN19)(左、右),以及qSL4B位点k4B5130标记的3个等位基因组间SL、GN、GS和SC的差异。1 / qGN4B.2 / qGS4B。2个位点采用方差分析(ANOVA)进行分析(中)。A为YG5等位基因,B为YN19等位基因,H为杂合子。(C) qSL4B.1/qGN4B.2/qGS4B中鉴定的9个注释基因。2个区域(上)和在不同发育阶段在穗上表达的两个基因(下)。KNI、KNII、KNIII、KNIV、KNV和KNVI是科农9204穗发育早期的6个阶段。Z32、Z39和Z65分别表示Zodak生育期Z32、Z39和Z65中国春穗上的基因表达
图5 qSN5A.3/qSL5A.1/qGN5A.3/qGS5A候选基因的验证5A染色体穗性状2QTL。(A)5AL上鉴定的穗长(SL)、粒数(GN)和粒实(GS) qtl的局部曼哈顿图和连锁不平衡(LD)热图。仅显示每个QTL的LD区峰内的snp (B)F2群体与其亲本世麦12 (SM12)和山农4155 (SN4155)的SL、GN和GS性状的频率分布(左、右),以及qSN5A.3/qSL5A.1/qGN5A.3/qGS5A等位基因的表型比较。基于k5A4185 KASP标记的SM12/SN4155群体SL、GN和GS性状的2QTL(中)。A为SN4155的等位基因,B为SM12的等位基因,H为杂合子(C)qSN5A.3/qSL5A.1/qGN5A.3/qGS5A中的6个注释基因。2QTL区域(上)和叶片和穗在不同发育阶段表达的三个基因(下)。KNI、KNII、KNIII、KNIV、KNV和KNVI是指小麦品种科农9204的6个穗前发育阶段。叶子。Z10,叶。Z23,叶。Z71飙升。Z32飙升。Z39和spike。Z65是指中国春季的三叶和穗发育阶段
(3)GL的候选区域 qGL1B.2 在 1BL 上处于 639.4–642.1 Mb 的区间内(图 6A)。将该地区最重要的 SNP 转化为 KASP 测定 (k1B9663),以从 YN19 (大粒) 与 GH9 (小粒)杂交中筛选 F2 群体。在人群的不同基因型组之间观察到 TGW 、 GL 和 GLWR 的显著差异。YN19 等位基因增加 GL 、 TGW 和 GLWR (图 6B)。考虑到泛素途径在调节植物颗粒形状和大小中的关键作用 (Shi et al., 2019),TraesCS1B02G415500 是最可能的 qGL1B.2 候选基因。
图6 qgl1b.2区域候选基因的验证。(A)局部曼哈顿图和qGL1B.2内snp的连锁不平衡(LD)热图。(B) F2群体及其亲本GH9和烟农19的千粒重(TGW)、粒长(GL)、粒宽(GW)和粒长宽比(GLWR)频次分布(左、右);基于k1B9663 KASP标记的TGW、GL、GW和GLWR等位基因QTL间表型的方差分析(中)。箭头指向双亲GH9和YN19。A为GH9的等位基因,B为YN19的等位基因,H为杂合子。(C) QTL区38个带注释的基因(上)和3个候选基因在中国春3个发育阶段5个组织中的表达量(下)。
注:文献解读主要用于个人学习,也欢迎大家交流,解读有误之处或有侵权请指出,公众号及时修改。