文章题目:Early estimation of glutelin to gliadin ratio in wheat grain using high-dimensional and hyperspectral reflectance
发表期刊:《Computers and Electronics in Agriculture》
影响因子:7.7
通讯单位:中国农科院农业可持续发展研究所
通讯作者:许吟隆,贺勇
在线日期:2024-10-23
及时准确地估算小麦籽粒的谷蛋白与醇溶蛋白比率 (Glu/Gli) 对作物监测至关重要,因为它是确保生产优质小麦粉的关键质量指标。尽管高光谱技术在作物表型估计方面的潜力已被认可,但由于复杂的光谱-化学关系和生长季节的影响,其在小麦籽粒 Glu/Gli 估算中的应用面临着挑战。本研究通过培育 11 个小麦品种并在小麦不同生长阶段(2018-2019 年和 2019-2020 年)的田间试验收集高维高光谱数据来解决这一空白。利用植被指数 (VI) 结合线性混合效应模型 (LMM) 和随机森林回归模型 (RFR),构建了一个稳健的 Glu/Gli 估计模型(Glu/Gli 范围为 1.063 至 2.218)。结果表明,单一 VI 应用存在数据限制,而多个 VI 的集成可显著提高估算精度。灌浆中期是准确估算 Glu/Gli 的关键阶段,TCARI(转化叶绿素吸收反射指数)表现出显著的显著性和高相关性。在模型性能方面,RFR(R2 = 0.691,rRMSE = 0.096,RPD = 1.872,RER = 6.028)优于 LMM(R2 = 0.477,rRMSE = 0.131,RPD = 1.383,RER = 4.453),在估算不同小麦品种的籽粒 Glu/Gli 方面表现出更高的精度。本研究介绍了一种快速准确的早期小麦籽粒 Glu/Gli 估算方法,为小麦价值链和精准农业提供了宝贵的见解。
图1. 试验点地理位置及材料遗传多样性。a,本研究中使用的小麦品种来源地分布,绿色深度表示小麦品种数量,颜色越深,表示来自该省的品种数量越多。b,本研究的地理位置(红点)。
图2. 验证模式和交叉验证图。a、Glu/Gli 的 LMM 估计验证模式;b、Glu/Gli 的 RFR 估计验证模式;c、交叉验证图解。AIC,赤池信息准则;BIC,贝叶斯信息准则;VIF,方差膨胀因子;CV,交叉验证。
图3. 2018-2019 年和 2019-2020 年生长季小麦粒 Glu/Gli 的分布及其遗传性。
图4.2018-2019 年和 2019-2020 年生长季期间所选 12 个 VI 的动态变化。
图5. 十四个 VI(x 轴)与谷粒 Glu/Gli(y 轴)呈显著(p < 0.05)线性关系。LMM 拟合的线性模型显示谷粒 Glu/Gli 与 CI_F、NDSI_F、RSI_F、MTCI_F、NDSI_M、NDVI_M、NDWI_M、RSI_M 呈显著正相关(红色),谷粒 Glu/Gli 与 SIPI_F、PRI_E、NWI_M、SIPI_M、TCARI_M、TCARI_L 呈负相关(蓝色)。线下的阴影区域表示 95% 置信区间。VI 的后缀_F、_E、_M 和_L 分别代表开花期、灌浆早期、灌浆中期和灌浆晚期。所有变量均通过将其转换为 z 分数进行标准化。
图6.网格搜索和5次重复以及5次交叉验证的结果。a,VI在确定小麦粒Glu/Gli中的重要性,橙色的深度表示VI的%IncMSE。颜色越深,%IncMSE越高,表明相应VI对Glu/Gli的影响越大。b,使用MSR调整RFR参数(ntree和mtry)。测试了从100到600(间隔100)的Ntree值,测试了从2到10的mtry值。选择产生最小MSR的ntree和mtry值,分别为100和2。%IncMSE,均方误差的增加。MSR,最小均方残差。Ntree,要生长的树的数量。Mtry,每次分裂时随机抽样的候选变量数。
图7.LMM(a)和 RFR(b)的测量 Glu/Gli 和估计 Glu/Gli 散点图(1:1,虚线)。试验在中国河南进行了两年。2018 年至 2020 年在中国河南省新乡市(北纬 35°18′,东经 113°51′)进行了 LMM 和 RFR 训练和测试田间试验。训练数据(2018-2019 年生长季);测试数据(2019-2020 年生长季)。VI 的后缀_F、_E、_M 和_L 分别代表开花期、灌浆早期、灌浆中期和灌浆晚期。