小麦籽粒谷蛋白/醇溶蛋白比值(Glu/Gli)是保证小麦粉品质的重要指标,准确、及时地测定其含量对作物品质监测具有重要意义。尽管高光谱技术在作物表型估计中具有公认的潜力,但由于复杂的光谱-化学关系和生长季节的影响,其应用于估计小麦籽粒中的Glu/ Gli面临挑战。
2024年10月23日,中国农业科学院马俊杰在《Computers and Electronics in Agriculture》(IF=7.7)上发表的题为“Early estimation of glutelin to gliadin ratio in wheat grain using high-dimensional and hyperspectral reflectance”的文章,通过培育11个小麦品种,并在小麦的各个生长阶段(2018-2019年和2019-2020年)从田间实验中收集高维高光谱数据,利用植被指数(VIs)结合线性混合效应模型(LMM)和随机森林回归模型(RFR),构建了一个稳健的Glu/Gli估计模型(Glu/Gli范围为1.063 ~ 2.218),为小麦价值链和精准农业提供了有价值的见解。
一、材料和方法
实验在中国河南省新乡市进行,选择了11个来自中国不同地区的小麦品种,以确保Glu/Gli的遗传多样性和实验结果的代表性。实验采用随机完全区组设计,每个品种在两个不同的区组中重复,共得到40个样本。每个小区面积为4.2平方米,包含6行,行距为0.2米。灌溉、施肥和病虫害控制策略根据当地独特的土壤和气候条件定制。
图1.试验地点的地理位置和材料的遗传多样性。(a)本研究中使用的小麦品种的原产地分布,绿色的深度表示小麦品种的数量,较深的阴影表示来自该省的品种数量较多。(b)进行本研究的地理位置(红点)。
二、 Glu/Gli的测定
使用不同的溶剂(蒸馏水、2%氯化钠溶液、70%乙醇溶液和0.5%氢氧化钾溶液)顺序提取成熟小麦籽粒中的蛋白质含量,包括白蛋白、球蛋白、醇溶蛋白和谷蛋白。使用微量凯氏法测定氮含量和蒸馏,评估谷蛋白和醇溶蛋白组分。
三、高光谱数据获取和处理
使用Field Spec 3高光谱光谱仪测量每个小区的冠层反射率。光谱仪的波段范围为350-2500 nm,可见光至近红外范围(350-1000 nm)的光谱分辨率为3 nm,短波红外区域(1000-2500 nm)的光谱分辨率为10 nm。在开花、早期籽粒灌浆、中期籽粒灌浆和晚期籽粒灌浆阶段进行光谱测量。
四、结果
1、不同生长季节中Glu/Gli和VIs的差异
2018-2019年和2019-2020年生长季采集的小麦Glu/Gli和VIs分布情况见图3和图4。每个生长季节的Glu/Gli呈现近似正态分布,与2019-2020季节相比,2018-2019生长季节的Glu/Gli略低。Glu/Gli的遗传力为0.859。这种高遗传力表明它更容易进行遗传估计和选择。两个生长季不同生长阶段的VIs指数不同。开花期的VIs指数、灌浆前期的PRI、RSI和SIPI、灌浆中期的PRI、SIPI和TCARI以及灌浆后期的MTCI、NDSI、NDWI、NWI和TCARI在两个生长季间差异不显著。2018-2019年和2019-2020年生长季,VIs在繁殖期的动态趋势基本一致(图4)。从开花期到灌浆后期,除NWI和SIPI外,VIs指数在两个生长季均呈持续下降趋势。然而,TCARI在2018-2019年生长季显示出持续增长,并在2019-2020年生长季呈现出先增长后下降的趋势,这可能是由于与2019-2020年生长季相比,2018-2019年生长季TCARI下降的时间较晚。
图3. 2018-2019年和2019-2020年生长季小麦籽粒Glu/Gli分布及小麦籽粒Glu/Gli遗传力。
图4. 2018-2019年和2019-2020年生长季12个选定VIs的动态变化。F、E、M、L分别代表开花期、灌浆前期、灌浆中期和灌浆后期。
2、不同生长阶段使用VIs估算籽粒Glu/Gli
图5展示了个体与Glu/Gli之间的线性关系。共有14个VIs(阶段× VI)与谷物Glu/Gli呈显著(p < 0.05)线性回归关系。结果表明,Glu/Gli的估算精度在不同生长阶段存在差异。其中,灌浆中期的VIs最多,约占总量的50.00%,R2值在0.191 ~ 0.420之间,rRMSE值在28.658 ~ 33.859之间,RPD值在1.141 ~ 1.348之间,RER值在3.794 ~ 4.483之间(图5g-m)。此外,与其他VIs相比,灌浆中期的TCARI在估计小麦Glu/Gli方面表现出最佳性能,具有最高的R2、RPD和RER值,以及最低的rRMSE值(R2 = 0.420,rRMSE = 28.658,RPD = 1.348,RER = 4.483,图5 m)。其次是开花期的VIs,占总数的35.71%,R2值在0.199 - 0.297之间,rRMSE值在31.569 - 33.682之间,RPD值在1.147 - 1.223之间,RER值在3.814 - 4.069之间(图5a-e)。灌浆前期和灌浆后期各有一个VI,占总量的7.14%,R2值分别为0.209和0.179,rRMSE值分别为33.484和34.107,RPD值分别为1.153和1.132,RER值分别为3.837和3.767(图5 f,n)。该分布突出了不同生长阶段对Glu/Gli估计的准确性的影响,其中灌浆中期的影响最大。
图5. 14个VIs(x轴)显示出与晶粒Glu/Gli(y轴)的显著(p < 0.05)线性关系。LMM线性模型拟合结果表明,籽粒Glu/Gli与CI_F、NDSI_F、RSI_F、MTCI_F、NDSI_M、NDVI_M、NDWI_M、RSI_M呈显著正相关(红色),与SIPI_F、PRI_E、NWI_M、SIPI_M、TCARI_M、TCARI_L呈显著负相关(蓝色)。线条下方的阴影区域表示95%置信区间。VIs的后缀_F、_E、_M和_L分别表示开花期、灌浆前期、灌浆中期和灌浆后期。
3、不同算法中多个VIs估算Glu/Gli
通过LMM和RFR算法进一步探讨了不同生长阶段多个VIs对Glu/Gli的影响。图7说明了估算小麦籽粒Glu/Gli的准确性随不同的统计方法而变化。在小麦Glu/Gli的LMM估计中,将48个VIs(阶段× VI)作为固定效应变量,将区组作为随机效应变量。通过逐步回归分析和基于赤池信息准则(AIC)、贝叶斯信息准则(BIC)的选择,确定了最优的LMM。通过方差膨胀因子(VIF)检验评估了用于构建模型的VI之间的潜在多重共线性,最大VIF为2.68,表明成功消除了多重共线性。Glu/Gli估计值的散点图结合模拟结果表明,小麦籽粒Glu/Gli的变化主要由开花期和灌浆早期的PRI以及开花期和灌浆中期的TCARI解释(图7a)。RFR可作为小麦籽粒Glu/Gli的有效估测工具。在利用RFR估计小麦籽粒Glu/Gli的过程中,利用训练数据集和MSR对参数(ntree和mtry)进行了优化,以找到最佳估计小麦Glu/Gli的值。测试了100 - 600范围内的Ntree值,间隔为100,测试了2 - 10范围内的mtry值(图6 b)。选择产生最小MSR的ntree和mtry值。如图6 b所示,最佳的ntree和mtry值分别为100和2。通过使用RFR算法,我们发现小麦籽粒Glu/Gli的变化主要由籽粒灌浆中期的TCARI和SIPI解释(图7 b)。随后,在籽粒灌浆中期,使用小麦籽粒Glu/Gli和TCARI及SIPI的训练数据对RFR进行训练,并在测试集上进行测试,得到了估计的籽粒Glu/Gli值的散点图(图7 b)。RFR在估算小麦籽粒Glu/Gli中表现出显著的性能。研究结果表明,小麦Glu/Gli的LMM的R2为0.477,而小麦Glu/Gli的RFR的R2为0.691。这表明,与LMM相比,RFR成功解释了Glu/Gli中更大部分的方差。LMM的rRMSE为0.131,而RFR为0.096,LMM的RPD为1.383,而RFR为1.872。这表明RFR在预测小麦Glu/Gli时提供了更准确的估计,平均误差更小。LMM的RER为4.453,而RFR的RER为6.028(大于5.0)。综上,RFR在估算小麦籽粒Glu/Gli方面表现出色,R²为0.691,rRMSE为0.096,RPD为1.872,RER为6.028。
图6.网格搜索和5次重复和5次交叉验证的结果。(a)VIs在测定小麦籽粒Glu/Gli中的重要性,橙子的深度表示VIs的%IncMSE。阴影越深表示%IncMSE越高,表明相应VIs对Glu/Gli的影响越大。(b)使用MSR调整RFR参数(ntree和mtry)。Ntree值的范围为100 ~ 600,间隔为100,mtry值的范围为2 ~ 10。选择产生最小MSR的ntree和mtry值,分别为100和2。%IncMSE,均方误差的增加。MSR,最小均方残差。Ntree,要生长的树的数目。Mtry,每次拆分时随机抽样的候选变量数。
图7.LMM(a)和RFR(b)的测量Glu/Gli和估计Glu/Gli的散点图。2018年至2020年,在中国河南省新乡市(35 18′ N,113 51′ E)进行了LMM和RFR训练和测试的现场测试。培训数据(2018-2019年生长季);检测数据(2019-2020年生长季)。VIs的后缀_F、_E、_M和_L分别表示开花期、灌浆前期、灌浆中期和灌浆后期。
总结:本研究旨在利用高维高光谱数据和先进的统计模型对小麦籽粒中的Glu/Gli进行早期估算。研究表明,多个VIs的集成通过反映氮状态和衰老过程提高了估算的准确性。特别是,在中期籽粒填充阶段进行Glu/Gli估算可以获得最精确和可行的结果。LMM和RFR的性能强调了它们的有效性,其中RFR在适应VIs与蛋白质积累过程之间的复杂关系方面表现出优越性。本文提供了一个关于如何利用高光谱技术和机器学习模型来早期估算小麦籽粒中Glu/Gli比例的详细研究。通过在不同生长阶段整合多个植被指数(VIs),研究建立了一个稳健的Glu/Gli估算模型,为小麦价值链和精准农业提供了宝贵的见解。
注:“本文仅为学术交流,更详细信息请查阅全文。如有侵权或内容不当之处,请联系本公众号删除修改”