Plant Phenomics | 南京农业大学联合江苏省农业科学院基于成像高光谱技术和GWAS分析的水稻籽粒蛋白质含量表型研究

学术   三农   2024-07-24 14:30   江苏  

→查看原文   →查看PDF


籽粒蛋白质含量Grain protein content, GPC是稻米营养与食味品质的重要决定因素。快速获取水稻GPC并识别与其相关的基因,对于了解其遗传基础和选育现代化优质水稻品种具有重要意义。高光谱技术的发展为缩小表型组学与基因组学之间的差距提供了一种新的分析方法。然而受限于数据集有限,难以构建高精度、适应大量品种的GPC估测模型。生成对抗网络(Generative adversarial networks, GAN)的出现很好地解决了这个问题。GAN已被证实能够生成对人类评估者来说似乎是真实的模拟数据。GAN用于大量水稻品种数据增强的可行性目前仍不清楚。同时,大部分研究仅关注于前期少量品种目标性状的监测预测,忽视了后期探究目标性状预测值在实际育种中能否发挥和实测值相同的遗传解析效力。


2024年7月,Plant Phenomics在线发表了由南京农业大学国家信息农业工程技术中心和江苏省农业科学院种质资源与生物技术研究所共同完成的题为Grain Protein Content Phenotyping in Rice via Hyperspectral Imaging Technology and a Genome-Wide Association Study 的研究论文。

本研究基于两年的大田水稻表型试验,获取了515个品种的GPC实测值以及单核苷酸多态性(Single nucleotide polymorphism, SNP)位点数据。利用N25E高光谱成像仪获取每个品种成熟期精米的高光谱影像。水稻GPC表型监测主要包括四个主要步骤:数据获取、数据增强、模型构建和关联分析。首先利用原始数据集训练深度卷积生成对抗网络,并生成大量模拟数据,从而构建具备不同样本量的训练数据集。然后利用连续小波变换提取敏感特征,为了消除冗余特征,引入相关性和递归特征消除来确定最优特征子集,并构建GPC估测模型。最后对比GPC实测值和估测值的全基因组关联分析结果(图1)


图1 水稻GPC估测及全基因组关联分析流程图


研究结果表明不同训练样本量下的PLSR模型对GPC的估测精度。随着模拟数据量的增加,模型的估测精度呈现先上升再下降的趋势。当模拟数据量为+200时,基于全小波特征(R2=0.50, RRMSE = 7.27%)和优选特征(R2 =0.58, RRMSE = 6.70%)的PLSR模型对于测试集的估测精度均达到最高。从统计学角度来看,基于全小波特征模型的R2增加了22.0%,RRMSE减少了12.8%,同时基于优选特征模型的R2增加了13.7%,RRMSE减少了8.5%。


本研究对实测GPC、基于原始数据的GPC估测值(训练数据为276时基于优选小波特征训练的PLSR模型)以及基于模拟数据的GPC估测值(模拟数据为200时基于优选小波特征训练的PLSR模型)的GWAS结果进行了对比分析(注:后文两种估测值分别用估测值1和估测值2表示)。从图2可以看出三者都定位到同一位点(SNP12.5076465),并且估测值2与实测GPC和估测值1均有两个lead SNPs重合,分别为SNP12.5076465和SNP7.10830236以及SNP12.5076465和SNP5.10266233。同时发现三个特征中仅有估测值2定位到的SNP4.17571584的±100kb范围内可检测到籽粒储藏蛋白相关基因OsmtSSB1L。通过对比估测值和实测值检测到的位点的异同,可以得出结论,基于DCGAN的GPC预测值具备良好的代替实测值进行遗传解析的能力。这项工作证明了生成模型可以作为实现大量水稻品种GPC高精度估测的重要研究方法,为基于高光谱技术的水稻表型性状高效遗传研究提供了一种潜在新方法。


图2 实测GPC、基于实测数据的GPC估测值、基于生成数据的GPC估测值的曼哈顿图(a、c、e)和QQ图(b、d、f)


本研究由南京农业大学国家信息农业工程技术中心和江苏省农业科学院种质资源与生物技术研究所共同完成,我校青年教师郑恒彪副研究员、江苏省农科院唐伟杰助理研究员、研究生杨涛(已毕业)为论文第一作者,姚霞教授和张云辉研究员为通讯作者。农学院曹卫星教授、朱艳教授、程涛教授参与了研究工作。成果获得国家重点研发项目、国家自然科学基金项目和江苏省生物育种钟山实验室等资助。


文链接:
‍https://doi.org/10.34133/plantphenomics.0200


——推荐阅读——

A precise framework for rice leaf disease image-text retrieval using FHTW-Net

https://doi.org/10.34133/plantphenomics.01‍68

Plant Phenomics | 中南林业科技大学周国雄教授团队基于FHTW-Net的水稻叶片病害图文检索精确框架


Establishing a Gross Primary Productivity Model by SIF and PRI on the Rice Canopy

https://doi.org/10.34133/plantphenomics.0144

Plant Phenomics | 南京信息工程大学等单位利用日光诱导叶绿素荧光和光化学植被指数建立了水稻冠层总初级生产力模型


加入作者交流群

扫码添加小编微信,拉您进入《植物表型组学》作者交流群,群内不定期开展作者分享会、专刊发布会等高质量活动。


添加小编微信,备注姓名+单位+PP,加入作者交流群

About Plant Phenomics

《植物表型组学》(Plant Phenomics)是由南京农业大学和美国科学促进会(AAAS)合作创办的英文学术期刊,于2019年1月正式上线发行。采用开放获取形式,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。具体范围涵盖高通量表型分析的最新技术,基于图像分析和机器学习的表型分析研究,提取表型信息的新算法,作物栽培、植物育种和农业实践中的表型组学新应用,与植物表型相结合的分子生物学、植物生理学、统计学、作物模型和其他组学研究,表型组学相关的植物生物学等。期刊已被DOAJScopusPMCEISCIE等数据库收录。科睿唯安JCR2022影响因子为7.6,位于农艺学、植物科学、遥感一区。2023年中科院期刊分区位于农林科学大类一区2020年入选中国科技期刊卓越行动计划高起点新刊项目、2024年入选江苏科技期刊卓越行动计划领军期刊项目。


说明:本文由《植物表型组学》编辑部负责组稿。

中文内容仅供参考,一切内容以英文原版为准。

排版苏梓钰(南京农业大学)

审核:孔敏、王平

点击下方“阅读原文查看英文原文

植物表型组学
《植物表型组学》(Plant Phenomics)是南京农业大学主办的英文学术期刊,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。
 最新文章