Mol Plant|中国农大小麦研究中心建立小麦籽粒储藏蛋白泛基因组图谱和表型预测模型,助力加工品质遗传改良

文摘   2024-05-30 09:03   北京  


2024年5月24日,中国农业大学农学院小麦研究中心Molecular Plant杂志上以长文(Research Article)形式在线发表了题为“A k-mer-based pangenome approach for cataloging seed-storage-protein genes in wheat to facilitate genotype-to-phenotype prediction and improvement of end-use quality”的研究论文。

随着消费水平的提高,我国对优质专用小麦的需求逐年增加。然而,小麦的品质育种面临品质性状鉴定难、可利用的高效基因稀缺等问题。而籽粒储藏蛋白(SSP)—由醇溶蛋白和谷蛋白构成—是决定小麦加工品质的关键。由于SSP编码基因序列重复性高、拷贝数多、品种间结构变异复杂,在已组装的小麦基因组中常存在缺口,导致其研究进展缓慢,限制了其在育种上的应用。因此,迫切需要在泛基因组水平上建立对小麦籽粒储藏蛋白基因的精确分型方法,挖掘和鉴定高生产力等位基因变异,助力改进小麦加工品质育种。


01

设计了基于基因特异k-mer

在泛基因组水平对小麦SSP基因

进行分型的计算策略(PanSK)

该研究通过整合基因组组装、已发表的SSP序列信息和ISO-seq数据,在小麦泛基因水平确定了139个SSP基因集合,并获得了SSP基因的特异k-mer序列。PanSK可应用于SSP基因的组装,有效解决了参考基因组中SSP基因组装质量低、存在大量缺口的问题(图1)。PanSK仅需要4×测序深度的重测序数据就能高精度地识别小麦不同品种SSP基因存在/缺失变异和核苷酸多态性,这为高效挖掘加工品质优异SSP基因提供了重要的技术基础。

图1 PanSK分析策略及应用


02

利用PanSK绘制了

小麦SSP基因的泛基因组图谱

挖掘了小麦加工品质相关的

SSP优异等位变异

通过分析365份不同来源的小麦种质资源重测序数据,明确了各个小麦品种中的SSP基因的组成、存在/缺失变异(PAV)以及核苷酸多态性,从而建立了详尽的SSP泛基因组图谱(图2A)。研究发现,不同品种SSP基因的数目存在显著变异(图2B),其中地方品种显示丰富的SSP变异,但每个材料的拷贝数较少;现代育成品种中SSP变异少但拷贝数增加(图2C)。这表明在育种选择过程中,SSP基因的拷贝数具有较高的可塑性,可能对小麦的加工品质有重要影响。基于k-mer的关联分析挖掘了23个与加工品质密切相关的SSP基因及31个优良的等位变异(图2D)。编码醇溶蛋白的Gli-γ-1B-3基因在自然群体中存在3种等位变异分别为Gli-γ-1B-3h1, Gli-γ-1B-3h2Gli-γ-1B-3h3,与Gli-γ-1B-3h1相比,Gli-γ-1B-3h2/3都在起始密码子下游277 bp对处发生了C到T序列改变,导致氨基酸序列提前终止(图2E),该基因功能丧失有助于改善小麦的加工品质(图2F)。这一结果为小麦加工品质改良提供了重要的基因资源,也显示了利用基因型与表型关联分析来发掘小麦品质改良潜力的有效性。

图2 基于k-mers的SSP变异分析

03

建立了基于k-mer

对小麦加工品质表型

预测的机器学习模型

利用上述与加工品质关联的k-mers,开发了利用SSP基因型预测加工品质表型的机器学习模型“KPPer”。通过分析小麦自然群体的数据,模型预测的表型与实际品质测定结果之间的相关系数达到0.64;将模型推广到高代稳定重组自交系(RIL)群体中也展示了优异的预测能力。基于这些结果,该研究提出了基于SSP基因型预测加工品质的基因组选择育种策略。此策略利用KPPer模型筛选出携带优良SSP等位变异且这些优良变异互补的资源作为育种双亲;在F2分离群体中,KPPer模型可用于预测中选单株的加工品质,辅助育种家选择品质性状优异的单株,显著提升品质育种选择效率(图3)。这种整合机器学习模型与高效育种技术的方法为小麦品质育种提供了一个有效的新途径。

图3 小麦加工品质性状预测模型及应用


04

结论与讨论

该研究首次在泛基因组水平上系统分析了小麦籽粒储藏蛋白(SSP)基因的变异,成功构建了基于SSP基因型的基因组选择模型。利用该模型,育种家能够在育种早期阶段预测小麦的加工品质表型,从而显著提高育种效率。这一成果不仅为揭示基因型与表型之间复杂关系提供了理论基础,通过将机器学习技术与高效育种技术相结合,为优质小麦新品种的精准分子设计及品质性状的选择提供了强有力的支持。


中国农业大学农学院小麦研究中心 姚颖垠 教授和 郭伟龙 副教授为论文共同通讯作者;已毕业硕士 张召衡 (现为中科院遗传与发育生物学研究所在读博士生)和已毕业博士 刘丹 (现为天津市农业科学院农作物研究所正高级工程师/副研究员)为论文共同第一作者;中国农业大学 孙其信 院士、倪中福 教授、彭惠茹 教授、辛明明 教授、胡兆荣 教授、刘杰 教授、杜金昆 副研究员,中国农业科学院农作物研究所 张学勇 研究员、郝晨阳 研究员,中国农业大学博士研究生 李彬永王文熙 等参与了该研究工作。该研究得到STI2030-重大项目(2023ZD04069)、国家自然科学基金(32125030)、拼多多-中国农业大学研究基金(PC2023A01003)和国家农业重大科技项目(NK20220601)的资助。


孙其信院士作为学术带头人的中国农业大学小麦研究中心长期围绕多倍体小麦广适性的遗传基础和分子机制、小麦产量性状形成、小麦品质性状遗传调控等一系列重要科学问题开展系统深入的研究。该团队在“十三五”期间共获得国家科技进步二等奖1项,国家技术发明二等奖1项,教育部高校科研优秀成果技术发明奖一等奖1项,中华农业科技奖优秀创新团队奖1项;近5年在小麦研究方向发表Nature、Nature Communications、Plant Cell、Molecular Plant等高水平研究论文50余篇。



END

藏粮于地、藏粮于技,作物科学是农业发展的关键。为促进作物领域科技创新进展交流,加强创新人才培养,弘扬学科优秀文化,推动现代农业高质量发展,在国内兄弟单位大力支持下,中国农业大学农学院牵头创立“作物科学联盟”公众号,旨在搭建作物科学领域创新思想的交流平台,弘扬科学家精神,传播科技兴农的新理念、新技术、新产品,引领全国作物学学科的创新与发展。


作物科学联盟
关注作物科学,报道最新研究成果,分享业内前沿动态
 最新文章