文章标题:High-resolution global maps of yield potential with local relevance for targeted crop production improvement
标题译文:全球高分辨率产量潜力地图:具有地方相关性的作物生产改进指导工具
发表期刊:Nature Food
在线时间:2024-7-29
通讯作者:Patricio Grassini
作者单位:Department of Agronomy and Horticulture, University of Nebraska-Lincoln, Lincoln, NE, USA
在不扩展农田的情况下,满足未来粮食需求是现代农业面临的巨大挑战。近日,《Nature Food》在线发表了Patricio Grassini教授团队的在作物产量潜力方面的最新研究进展。
研究表明,通过整合农业稳健的自下而上方法与机器学习,可以精准预测全球玉米、小麦、水稻的产量潜力,并生成了高分辨率的全球产量潜力地图。这些地图可以作为当前种植系统和水资源管理背景下农民产量的可靠参考,有助于识别具有巨大增产潜力的地区,为作物生产改进提供了新的科学依据。
研究内容
能否在不进行大规模土地转化的情况下满足未来粮食需求,取决于现有耕地的生产能力。估算产量潜力(Ypot,即本地作物栽培品种能达到的最大产量)是确定有较大增产空间地区的依据,并为从地方到全球水平的粮食安全、土地利用和气候变化研究提供重要信息。由于影响Ypot的因素存在空间和时间上的变异,以及在大尺度上通过田间试验测量Ypot的局限性,使用田间试验来测量Ypot并不可行。相反,可以通过经过良好验证的作物模型,结合高质量的天气、土壤和种植数据,在地方、区域和全球水平上估算Ypot。因此,大多数大规模研究依赖作物模拟模型来估算Ypot。
尽管使用作物模型估算Ypot的方法已经取得了共识,但在使用适当的空间框架方面仍存在争议。一方面,自上而下的模拟方法依赖于全球作物模型和合成的气候、土壤数据,虽然可以在全球范围内进行高分辨率估算,但缺乏地方验证,精度较低。另一方面,自下而上的方法基于代表性地点,使用测量的天气和土壤数据以及本地校准的作物模型,尽管精度高,但数据需求大且时间成本高。因此,需要一种结合两者优势的新方法。
在过去十年中,计算能力、土壤和气候的空间信息以及机器学习在地理空间分析中的应用方面的显著进步,提供了新工具,有助于解决自下而上和自上而下方法的局限性。在此,作者开发了一种称为“元模型(metamodel)”的方法来估算全球网格化Ypot。元模型在30弧秒 (约为1平方公里) 分辨率下,分别针对灌溉和雨养条件,应用于三大主要粮食作物 (玉米、小麦和水稻)。
该研究的方法包括三个主要步骤,既结合了传统的农业方法,又融入了现代的机器学习技术。
自下而上的作物模拟方法:基于全球产量差数据集 (GYGA),选择代表性地点,使用本地校准和评估的作物模拟模型,结合天气和土壤数据,估算这些地点的产量潜力(Ypot)。
机器学习模型训练:将特定地点的Ypot值与网格化的气候、土壤和种植系统数据结合,训练机器学习模型 (随机森林回归模型)。
全球网格化Ypot估算:利用训练好的机器学习模型,在特定作物和水资源管理组合的收获区域内估算网格化Ypot估算值,并评估相关的不确定性。
该研究展示的高分辨率产量潜力地图克服了“自下而上”方法的局限性。通过使用最先进的地理空间分析工具,作者的Ypot地图覆盖了90-95%的这些作物种植土地,且与GYGA Ypot相比精度损失不大 (均方根误差为13%到18%),确保了有针对性的估算网格化Ypot。此外,元模型方法足够灵活,可以容纳新数据,例如随着新的自下而上方法获得的Ypot数据,可以轻松更新元模型并应用于生成高空间分辨率的Ypot数据,最终生成更精确的全球Ypot地图。
该研究的方法相较于已发表的“自上而下”方法具有明显优势。自上而下方法估算的Ypot存在偏差,缺乏地方相关性。例如,对于美国中西部的雨养玉米,自上而下方法的Ypot估算值低于农民的平均产量,明显低估了Ypot。而元模型估算的Ypot一直高于农民产量。
该研究开发的元模型方法在估算网格化Ypot方面也有其局限性。首先,本研究的不确定性评估并不完整,因为它没有考虑GYGA Ypot估算的不确定性,这在缺乏测量天气数据和详细土壤地图的地方更大。GYGA Ypot中的误差会传递到元模型,影响其准确性。因此,更多和更好的本地观测天气和土壤数据可以帮助提高GYGA Ypot和元模型的准确性。其次,元模型在再现Ypot范围的极端值方面较弱。这些偏差在随机森林等机器学习算法中是常见的,尤其是在极端条件下的观测数量有限时。GYGA Ypot用于模型训练的地点优先考虑了占国家作物种植面积最大的一些主要作物生产地区。因此,元模型在边缘地带的不确定性最大,这些地区的Ypot较低且变异较大,作物面积相对较小,GYGA地点较少。在这些情况下,网格化Ypot往往超过GYGA Ypot。同样,GYGA Ypot非常高的地点较少,这可能解释了元模型在这些情况下低估了产量潜力。虽然可以探索更复杂的机器学习模型,但通过提升的全球数据质量以及增加自下而上方法的训练数据,可以获得更好的预测效果。此外,元模型不能应用于气候和土壤类型不同于用于模型训练的作物生产地区。对于这些地区,建议使用自下而上方法生成Ypot,而不是在模型训练环境范围外使用元模型。
图1:元模型示意图。该元模型将自下而上的方法与机器学习(ML)相结合,以估算高分辨率的全球产量潜力(Ypot)。元模型步骤 (1) 利用经过当地校准和评估的作物模型以及现有的最佳气象、土壤和耕作系统观测数据,对选定的地点进行产量潜力估算。(2) 利用特定地点的 Ypot 和相关的网格环境预测因子训练 ML 算法。(3) 对 ML 模型的适用区域进行全球网格 Ypot 估算,并评估其预测的不确定性。
图2:2020 年前后三种主要谷物作物的全球网格产量潜力。利用全球产量差图集(GYGA,www.yieldgap.org )中特定地点的Ypot 值训练的机器学习元模型,以30弧秒的空间分辨率估算了灌溉和雨养玉米、小麦和水稻的产量潜力(Ypot)。
扫码关注我们
微信号 : ZWSLST_2020
邮箱:maize2020@126.com