Agric. Water Manag.|机器学习模型与可解释人工智能在农业干旱预测中的比较分析:以大丕山脉为例

文摘   2024-12-11 12:52   美国  
DOI:https://doi.org/10.1016/j.agwat.2024.109176

全球气候变化导致干旱发生频率和严重程度不断上升,给农业带来了重大挑战,尤其是在经济严重依赖农业的中国大别山区。准确的干旱预测和理解机制对于减少干旱相关的损失至关重要。本研究提出了一个将机器学习与可解释人工智能 (XAI) 相结合的框架,以预测和分析大别山区的农业干旱。该框架采用四种机器学习模型:极端梯度提升 (XGBoost)、随机森林 (RF)、长短期记忆 (LSTM) 网络和反向传播神经网络 (BPNN)。这些模型基于 2000 年至 2021 年的数据进行训练,并以 2022 年作为独立案例研究来评估其预测准确性。

结果表明,XGBoost 和 RF 模型在所有指标上都表现出很高的准确性,明显优于 LSTM 和 BPNN 模型。此外,该框架将 Shapley 可加解释 (SHAP) 与 RF 和 XGBoost 模型相结合,以分析各种驱动因素对农业干旱事件的贡献。例如,在 2019 年秋季干旱中,气象特征贡献了 75.53%,而土壤、地形和社会经济因素分别贡献了 8.86%、8.59% 和 7.03%。分析研究了关键因素与空间模式之间的相互作用,显示了它们的贡献如何随干旱严重程度和位置而变化。这为了解不同因素在干旱预测中的作用提供了详细的见解。总之,该框架有可能通过数据更新实现近乎实时的干旱动态,并且可以应用于类似地区,帮助当地决策者制定有效的水资源管理战略。

图4.研究的流程图和结构图。

图 6.四种模型 (BPNN、LSTM、RF、XGBoost) 在四个性能指标上的性能评估。(a) 平均绝对误差 (MAE);(b) 均方根误差 (RMSE);(c) 空间差异指数 (SDI);(d) 判定系数 (R²)。

图 7 .四个模型的预测值与观测值的空间分布比较。 (a)-(d) BPNN、LSTM、XGBoost 和 RF 的预测值的空间分布。 (e) 观测值的空间分布。

图 8.四种机器学习模型(BPNN、LSTM、XGBoost、RF)的预测值与观测值的散点概率密度图。

图 9.使用Tree Explainer 对 RF 和 XGBoost 模型进行可解释性分析的汇总图。(a)和(b)显示了 RF 和 XGBoost 模型中每个特征的 SHAP 值分布。颜色表示特征值的大小,范围从黄色(高)到紫色(低)。横轴表示 SHAP 值(计算基于研究区域内的所有像素点)。

图10.基于SHAP值的降水和温度对干旱预测影响的依赖关系图。

图11不同干旱等级下的个体力图

图 12. 2019年大别山秋季干旱期间主要驱动因素的 SHAP 值空间分布。子图 (a) 和 (b) 说明了使用 RF 模型降水和温度对 SSMI 预测的影响,而子图 (c) 和 (d) 展示了 XGBoost 模型的相应结果。

图13. 2019年秋季月平均降水量(a)和气温(b)的空间分布。

图 14 .使用 RF(a、b)和 XGBoost(c、d)模型绘制的散点密度图,显示了 2019 年秋季大别山区降水量与 SHAP 值(a、c)以及温度与 SHAP 值(b、d)之间的关系。

干旱区气象生态拥有近1w活跃粉丝,是干旱区资源环境领域最大的自媒体平台,致力于帮助科研人员和团队宣传成果,促进学术交流。由于微信修改了推送规则,请大家将本公众号加为星标,一键三连,可以第一时间收到我们每日的推文!您的鼓励是我们最大的动力😊

干旱区气象生态
以干旱的监测预警为主题,重点关注数据和方法,拓展跟踪干旱相关的气象、生态及水文等前沿!!!欢迎提供优秀稿件,帮助宣传个人成果!!
 最新文章