解读者:欧京瑞
2023年7月20日,于强课题组在European Journal of Agronomy期刊上发表了题为Integrating machine learning and environmental variables to constrain uncertainty in crop yield change projections under climate change的文章,该研究通过将动态线性模型(DLM)和随机森林机器学习模型(RF)分别与9个全球网格作物模型(GGCM)集成来整合和克服这两种建模框架的缺点,以改善玉米和大豆预测的不确定性。
研究目的
1、通过从历史数据中再现观察到的玉米和大豆产量来提高模型的性能。
2、研究作物产量对ECE和CPD风险的非线性响应。
3、在未来气候情景下,比较GGCM单独的产量预测与混合模型的产量预测。
研究方法
随机森林机器学习模型 NWAI-WG统计降尺度方法 动态线性模型
玉米模拟模型包括9个模型(CARAIB、EPIC-TAMU、JULES、GEPIC、LPJ-GUESS、LPJmL、pDSSAT、PEPIC和PROMET)
大豆模拟模型包括8个模型(CARAIB、EPIC-TAMU、JULES、GEPIC、LPJmL、pDSSAT、PEPIC和PROMET)
研究人员收集1999-2010年间155个站点的玉米产量试验数据和50个站点的大豆产量试验数据。
首先,将ggcm模拟器的输出、环境变量(ECEs和cpd)以及作物产量观测数据(从155个玉米和50个大豆站点收集)整合到动态线性模型(DLM)和随机森林(RF)模型中构建混合模型。
然后,使用混合模型来预测气候变化下的作物产量(由GCM驱动的GGCM模拟器计算)、ECEs(基于GCM)和CPDs。最后,比较GGCM模型和杂交模型的作物产量预测和不确定性来源。
研究结果
GGCM对作物产量的模拟精度较低,玉米的r值为0.15~0.61。nRMSE为0.18~0.50;大豆的r值为0.37~0.70,nRMSE为0.17~0.35。
杂交模型(GGCM+RF)表现出显著的改善,玉米的r范围为0.64~0.77,nRMSE范围为0.13~0.17;大豆的r范围为0.54~0.70,nRMSE范围为0.17~0.2。
用RF模型生成PDP,以证明环境因素与作物产量之间的非线性关系,对6个环境因子的相对重要性进行归一化处理,结果表明,玉米的主要影响因子为CD(33.5%)和CPD(23.4%),大豆的主要影响因子为CPD(22.6%)和TD(19.5%)。
对SSP126和SSP585下1980-2099年玉米和大豆产量变化的时间序列分析表明,GGCMs和杂交模型(GGCM+RF)预测玉米产量将大幅下降,特别是在2040年之后。
在SSP126情景下,GGCM模型预测2040年后大豆产量将呈上升趋势,而GGCM+RF模型预测2040年后大豆产量将呈下降趋势。
SSP585情景下,GGCM预测大豆产量将从2050年左右开始下降,而GGCM+RF模型预测的产量下降时间更早。
GGCM和GGCM+RF模拟预测了玉米产量的下降,两者预测的相似性表明GGCM模拟器充分反映了某些极端气候条件下的产量损失。
综上所述,作者团队成功开发了混合模型(GGCM+RF),通过考虑ECEs和CPD,将机器学习与作物模型相结合,从而提高了玉米和大豆产量预测的准确性,同时降低了整体的不确定性。今天分享的内容就到这里,如果您比较感兴趣,欢迎阅读原文。