Comput. Electron. Agric. |利用高维和高光谱反射率早期预测小麦籽粒中谷蛋白与醇溶蛋白比值

文摘   2024-11-29 07:30   陕西  

小麦籽粒谷蛋白/醇溶蛋白比值(Glu/Gli)是保证小麦粉品质的重要指标,准确、及时地测定其含量对作物品质监测具有重要意义。尽管高光谱技术在作物表型估计中具有公认的潜力,但由于复杂的光谱-化学关系和生长季节的影响,其应用于估计小麦籽粒中的Glu/ Gli面临挑战。

20241023日,中国农业科学院马俊杰Computers and Electronics in AgricultureIF=7.7上发表的题为Early estimation of glutelin to gliadin ratio in wheat grain using high-dimensional and hyperspectral reflectance的文章,通过培育11个小麦品种,并在小麦的各个生长阶段(2018-2019年和2019-2020年)从田间实验中收集高维高光谱数据,利用植被指数(VIs)结合线性混合效应模型(LMM)和随机森林回归模型(RFR),构建了一个稳健的Glu/Gli估计模型(Glu/Gli范围为1.063 ~ 2.218),为小麦价值链和精准农业提供了有价值的见解。

一、材料和方法

实验在中国河南省新乡市进行,选择了11个来自中国不同地区的小麦品种,以确保Glu/Gli的遗传多样性和实验结果的代表性。实验采用随机完全区组设计,每个品种在两个不同的区组中重复,共得到40个样本。每个小区面积为4.2平方米,包含6行,行距为0.2米。灌溉、施肥和病虫害控制策略根据当地独特的土壤和气候条件定制。

1.试验地点的地理位置和材料的遗传多样性。a本研究中使用的小麦品种的原产地分布,绿色的深度表示小麦品种的数量,较深的阴影表示来自该省的品种数量较多。b进行本研究的地理位置(红点)。

二、 Glu/Gli的测定

使用不同的溶剂(蒸馏水、2%氯化钠溶液、70%乙醇溶液和0.5%氢氧化钾溶液)顺序提取成熟小麦籽粒中的蛋白质含量,包括白蛋白、球蛋白、醇溶蛋白和谷蛋白。使用微量凯氏法测定氮含量和蒸馏,评估谷蛋白和醇溶蛋白组分。

三、高光谱数据获取和处理

使用Field Spec 3高光谱光谱仪测量每个小区的冠层反射率。光谱仪的波段范围为350-2500 nm,可见光至近红外范围(350-1000 nm)的光谱分辨率为3 nm,短波红外区域(1000-2500 nm)的光谱分辨率为10 nm。在开花、早期籽粒灌浆、中期籽粒灌浆和晚期籽粒灌浆阶段进行光谱测量。

四、结果

1不同生长季节中Glu/GliVIs的差异

2018-2019年和2019-2020年生长季采集的小麦Glu/GliVIs分布情况见图3和图4。每个生长季节的Glu/Gli呈现近似正态分布,与2019-2020季节相比,2018-2019生长季节的Glu/Gli略低。Glu/Gli的遗传力为0.859。这种高遗传力表明它更容易进行遗传估计和选择。两个生长季不同生长阶段的VIs指数不同。开花期的VIs指数、灌浆前期的PRIRSISIPI、灌浆中期的PRISIPITCARI以及灌浆后期的MTCINDSINDWINWITCARI在两个生长季间差异不显著。2018-2019年和2019-2020年生长季,VIs在繁殖期的动态趋势基本一致(图4)。从开花期到灌浆后期,除NWISIPI外,VIs指数在两个生长季均呈持续下降趋势。然而,TCARI2018-2019年生长季显示出持续增长,并在2019-2020年生长季呈现出先增长后下降的趋势,这可能是由于与2019-2020年生长季相比,2018-2019年生长季TCARI下降的时间较晚。

3. 2018-2019年和2019-2020年生长季小麦籽粒Glu/Gli分布及小麦籽粒Glu/Gli遗传力。

4. 2018-2019年和2019-2020年生长季12个选定VIs的动态变化。FEML分别代表开花期、灌浆前期、灌浆中期和灌浆后期。

2不同生长阶段使用VIs估算籽粒Glu/Gli

5示了个体与Glu/Gli之间的线性关系。共有14VIs(阶段× VI)与谷物Glu/Gli呈显著(p < 0.05)线性回归关系。结果表明,Glu/Gli的估算精度在不同生长阶段存在差异。其中,灌浆中期的VIs最多,约占总量的50.00%R2值在0.191 ~ 0.420之间,rRMSE值在28.658 ~ 33.859之间,RPD值在1.141 ~ 1.348之间,RER值在3.794 ~ 4.483之间(图5g-m)。此外,与其他VIs相比,灌浆中期的TCARI在估计小麦Glu/Gli方面表现出最佳性能,具有最高的R2RPDRER值,以及最低的rRMSE值(R2 = 0.420rRMSE = 28.658RPD = 1.348RER = 4.483,图5 m)。其次是开花期的VIs,占总数的35.71%R2值在0.199 - 0.297之间,rRMSE值在31.569 - 33.682之间,RPD值在1.147 - 1.223之间,RER值在3.814 - 4.069之间(图5a-e)。灌浆前期和灌浆后期各有一个VI,占总量的7.14%R2值分别为0.2090.179rRMSE值分别为33.48434.107RPD值分别为1.1531.132RER值分别为3.8373.767(图5 fn)。该分布突出了不同生长阶段对Glu/Gli估计的准确性的影响,其中灌浆中期的影响最大。

5. 14VIsx轴)显示出与晶粒Glu/Gliy轴)的显著(p < 0.05)线性关系。LMM线性模型拟合结果表明,籽粒Glu/GliCI_FNDSI_FRSI_FMTCI_FNDSI_MNDVI_MNDWI_MRSI_M呈显著正相关(红色),与SIPI_FPRI_ENWI_MSIPI_MTCARI_MTCARI_L呈显著负相关(蓝色)。线条下方的阴影区域表示95%置信区间。VIs的后缀_F_E_M_L分别表示开花期、灌浆前期、灌浆中期和灌浆后期。

3不同算法中多个VIs估算Glu/Gli

通过LMMRFR算法进一步探讨了不同生长阶段多个VIsGlu/Gli的影响。图7说明了估算小麦籽粒Glu/Gli的准确性随不同的统计方法而变化。在小麦Glu/GliLMM估计中,将48VIs(阶段× VI)作为固定效应变量,将区组作为随机效应变量。通过逐步回归分析和基于赤池信息准则(AIC)、贝叶斯信息准则(BIC)的选择,确定了最优的LMM。通过方差膨胀因子(VIF)检验评估了用于构建模型的VI之间的潜在多重共线性,最大VIF2.68,表明成功消除了多重共线性。Glu/Gli估计值的散点图结合模拟结果表明,小麦籽粒Glu/Gli的变化主要由开花期和灌浆早期的PRI以及开花期和灌浆中期的TCARI解释(图7a)。RFR可作为小麦籽粒Glu/Gli的有效估测工具。在利用RFR估计小麦籽粒Glu/Gli的过程中,利用训练数据集和MSR对参数(ntreemtry)进行了优化,以找到最佳估计小麦Glu/Gli的值。测试了100 - 600范围内的Ntree值,间隔为100,测试了2 - 10范围内的mtry值(图6 b)。选择产生最小MSRntreemtry值。如图6 b所示,最佳的ntreemtry值分别为1002。通过使用RFR算法,我们发现小麦籽粒Glu/Gli的变化主要由籽粒灌浆中期的TCARISIPI解释(图7 b)。随后,在籽粒灌浆中期,使用小麦籽粒Glu/GliTCARISIPI的训练数据对RFR进行训练,并在测试集上进行测试,得到了估计的籽粒Glu/Gli值的散点图(图7 b)。RFR在估算小麦籽粒Glu/Gli中表现出显著的性能。研究结果表明,小麦Glu/GliLMMR20.477,而小麦Glu/GliRFRR20.691。这表明,与LMM相比,RFR成功解释了Glu/Gli中更大部分的方差。LMMrRMSE0.131,而RFR0.096LMMRPD1.383,而RFR1.872。这表明RFR在预测小麦Glu/Gli时提供了更准确的估计,平均误差更小。LMMRER4.453,而RFRRER6.028(大于5.0)。综上,RFR在估算小麦籽粒Glu/Gli方面表现出色,R²为0.691rRMSE0.096RPD1.872RER6.028

6.网格搜索和5次重复和5次交叉验证的结果。aVIs在测定小麦籽粒Glu/Gli中的重要性,橙子的深度表示VIs%IncMSE。阴影越深表示%IncMSE越高,表明相应VIsGlu/Gli的影响越大。b使用MSR调整RFR参数(ntreemtry)。Ntree值的范围为100 ~ 600,间隔为100mtry值的范围为2 ~ 10。选择产生最小MSRntreemtry值,分别为1002%IncMSE,均方误差的增加。MSR,最小均方残差。Ntree,要生长的树的数目。Mtry,每次拆分时随机抽样的候选变量数。

7.LMMa)和RFRb)的测量Glu/Gli和估计Glu/Gli的散点图。2018年至2020年,在中国河南省新乡市(35 18′ N113 51′ E)进行了LMMRFR训练和测试的现场测试。培训数据(2018-2019年生长季);检测数据(2019-2020年生长季)。VIs的后缀_F_E_M_L分别表示开花期、灌浆前期、灌浆中期和灌浆后期。

总结:本研究旨在利用高维高光谱数据和先进的统计模型对小麦籽粒中的Glu/Gli进行早期估算。研究表明,多个VIs的集成通过反映氮状态和衰老过程提高了估算的准确性。特别是,在中期籽粒填充阶段进行Glu/Gli估算可以获得最精确和可行的结果。LMMRFR的性能强调了它们的有效性,其中RFR在适应VIs与蛋白质积累过程之间的复杂关系方面表现出优越性。本文提供了一个关于如何利用高光谱技术和机器学习模型来早期估算小麦籽粒中Glu/Gli比例的详细研究。通过在不同生长阶段整合多个植被指数(VIs),研究建立了一个稳健的Glu/Gli估算模型,为小麦价值链和精准农业提供了宝贵的见解。

注:“本文仅为学术交流,更详细信息请查阅全文。如有侵权或内容不当之处,请联系本公众号删除修改”


往期文章推荐

CHAT-GPT(无需翻墙,无需购买)全程0元购!!!

           

MATLAB | 十大经典算法以及代码实现

Python 数据可视化——基于 Matplotlib 模块


作物功能表型研究
记录分享作物功能表型领域研究动态~
 最新文章