标题:
Interpretability of deep learning models for crop yield forecasting
第一作者/通讯作者 :Dilli Paudel
荷兰瓦赫宁根大学
第二作者 :Allard de Wit
荷兰瓦赫宁根大学
🛰️🛩️🌱🌱🌱🌱🌱🌱🌱🌱🌱🧠💻
传统预测方法依赖之前实验设计的特征,但这种特征挖掘耗时且依赖经验,难以扩展到大规模应用。 深度学习提供了一种无需显式人工设计特征的端到端学习方法,但模型的“Black Box”特性使其难以解释,限制了实际应用。
探索深度学习模型在作物产量预测中的表现及其可解释性。 采集并开源首个基于无人机的大豆荚点标注数据集。 通过与当前最先进方法的对比,验证模型的实际适用性和鲁棒性。
研究方法:
无人机(DJI Mavic2)在13英尺高度和53-58度角下拍摄113张田间图像。 对比基于人工设计特征的机器学习方法(GBDT)与深度学习模型的性能差异。 通过人类专家的反馈,评估深度学习模型提取特征的合理性及其对实际农业知识的契合度。
模型架构:
采用LSTM(长短期记忆网络)和1D-CNN(单维卷积神经网络)处理时序数据。
特征包括静态特征(如土壤水分保持能力)、趋势特征(历史产量趋势)及季节性特征(气象和生物量数据)。
对比方法:
使用线性趋势模型和GBDT作为基线对比。
数据来源包括欧盟MARS系统,覆盖1999-2018年间的作物产量和环境数据。
模型架构:
采用Occlusion、Integrated Gradients和GradientShap方法生成特征重要性评分。
结合专家反馈分析特征重要性与实际农业知识的一致性。
静态特征的重要性和可解释性。 在 (a) 和 (b) 中,专家调查使用的尺度为:强烈负面影响(-1)、轻微负面影响(-0.5)、无影响(0)、轻微正面影响(0.5)、强烈正面影响(1)。每个条形内的划分代表不同专家的投票方式,例如,在 (b) 中,专家为 SM_WHC 分配了 -0.5、1、1 和 0.5。深度学习模型的重要性分数显示了特征对产量影响的大小和方向(正或负)。特征值从左到右从低到高(从蓝色到红色)代表正影响,反之亦然。在 (c) 中,轴表示对产量的影响方向(正或负)(方向)和特征影响的相对大小,括号中的数字表示专家的数量。对于专家少于四位的特征,有些专家没有投票或不了解其影响。静态特征:土壤持水能力(SM_WHC)、平均海拔(AVG_ELEV)、平均坡度(AVG_SLOPE)、平均田地面积(AVG_FIELD_SIZE)、总灌溉面积(IRRIG_AREA_ALL)、作为软小麦的谷物灌溉面积(IRRIG_AREA90)和玉米灌溉面积(IRRIG_AREA2)。
总结:评估了欧洲区域范围内软小麦和玉米深度学习模型的性能和可解释性。展示了深度学习在作物产量预测中的优势及其自动特征学习能力。同时,论文结合解释性方法和专家反馈,提供了一种评估模型可解释性的框架。该文章使用使用GradientShap结合专家知识评价模型解释性。将时序数据与静态特征整合到深度学习框架中,优化了特征学习。
推荐指数:⭐⭐⭐⭐⭐⭐ 非常好的一篇论文!!!
链接
—
https://doi.org/10.1016/j.compag.2023.107663【权责声明】