清华大学段雷教授团队使用可解释的机器学习模型重新评估了化肥引起的N2O排放的驱动因素

百科   2024-08-24 09:00   德国  

文章信息

文章题目:Reevaluating the drivers of fertilizer-induced N2O emissions insights from interpretable machine learning

发表期刊:《Environmental Science & Technology》

影响因子:10.8

第一单位:清华大学

通讯作者:段雷 教授

在线日期:2024-08-22

文章内容

研究背景

氧化亚氮(N₂O)是一种强效的温室气体,具有破坏臭氧层的潜力,自工业革命以来其大气浓度增加了20%以上。全球农业施肥直接导致的N₂O排放量在2007年至2016年间估计为每年2.3 Tg N,占全球人为N₂O排放量的30%以上,成为最大的单一人为排放源。随着全球人口增长和饮食结构变化,肥料引发的N₂O排放可能进一步增加。

目前,大多数研究依赖排放因子(EF)方法来估算农业土壤中的N₂O排放量。根据IPCC(气候变化专门委员会)的建议,旱地作物的默认排放因子为1%,水稻田的为0.4%。然而,这些默认值主要基于全球平均,忽略了气候、土壤和管理因素在区域层面上的影响,从而引入了较大的不确定性。

以往的研究表明,作物类型、肥料类型、土壤有机碳(SOC)、土壤pH、土壤质地和气候等因素都可能影响N₂O排放。此外,氮肥施用量也被认为是影响排放的重要因素。然而,这些因素的具体贡献和作用机制仍存在争议。例如,有些研究发现降水是影响排放的最重要因素,而土壤pH和SOC的影响不显著。另一些研究则认为土壤pH是主导因素,其影响远超气候因素。

鉴于N₂O排放的复杂性,不同因素对EF的影响往往被其他因素所掩盖,因此需要更深入的研究来揭示N₂O排放的驱动因素。这对于改进全球N₂O排放的估算和制定有效的控制策略至关重要。

研究目的

本研究旨在使用可解释的机器学习模型,评估和重新定义肥料引发的N₂O排放的主要驱动因素,特别关注那些在之前研究中存在争议或未明确的因素,以提高N₂O排放估算的准确性,并为全球减排策略提供依据。

材料和方法

研究收集了1134个来自229篇文献的肥料引发的N₂O排放观测数据,涵盖全球不同地区和作物类型。通过随机森林模型进行机器学习建模,并使用Shapley加值解释(SHAP)方法计算各变量的相对贡献。此外,采用广义线性模型(GLM)和部分相关系数等传统统计方法对机器学习结果进行验证。

研究结果

研究发现环境因素是N₂O排放的主要驱动因素。土壤和气候条件主导了N₂O排放因子的变异。尤其是土壤pH值、土壤有机碳(SOC)、降水量和温度对排放因子的影响最大。这些环境因素的影响力远超管理实践,如灌溉和施肥等。具体而言,土壤pH值对N₂O排放因子有显著的负面影响,成为最重要的环境因素。SOC、降水量和温度则对排放因子有显著的正面影响,这可能与这些因素促进了土壤微生物活性有关。土壤容重和黏土含量也会通过影响土壤孔隙度和厌氧条件来影响排放因子,但其影响不如前述四个环境因素显著。

虽然氮肥施用量对排放因子有正向影响,但这种影响在高施用量时趋于平稳,并未表现出预期的显著非线性关系。这与之前一些研究提出的非线性模型不一致。本研究发现,随着氮肥施用量的增加,氮肥对排放因子的影响逐渐减弱。在施用量较低(0-250 kg N/ha/yr)时,氮肥对排放因子的影响较为显著,但在更高的施用量下,这种影响趋于平缓。

研究揭示了土壤pH值对排放因子的三阶段影响:在高pH(7.3≤pH≤8.7)范围内,排放因子随着pH值的升高而增加;在低pH(约4.7≤pH≤6.8)范围内,排放因子没有明显趋势;而在pH值介于6.8到7.3之间时,排放因子随着pH值的降低而显著增加。这一发现表明,pH值对N₂O排放的影响在不同pH范围内存在显著差异,这可能与土壤中N₂O还原酶活性在不同pH条件下的变化有关。

温度和降水量对排放因子的影响呈现出显著的非线性特征。本研究发现,在高温和高降水条件下,排放因子可能会快速增加。这种非线性关系表明,在气候变化的背景下,某些地区的N₂O排放可能会显著增加。通过进一步分析不同作物类型下的非线性关系,研究发现,玉米的排放因子与温度呈指数关系,而水稻和其他作物的排放因子则与降水量呈指数关系

图1.环境和管理因素对 N2O 排放因子的影响。(a) 数据集中四种作物类型的平均 EF。(b) 数据集中的站点分布和区域 EF。误差线表示标准差。(c) 通过 Shapley 加性解释 (SHAP) 值计算的随机森林模型中的相对特征重要性。(d) 每个变量的 SHAP 值,表示对 EF 的影响(%)。


图2. GLM 的估计系数。***、** 和 * 分别代表显著性水平 0.001、0.01 和 0.05。误差线代表 95% 置信区间。肥料类型和作物类型是分类变量,这里的回归系数代表相对于参考类别尿素和小麦的影响。例如,与尿素相比,其他肥料类型的 N2O 排放量明显较低。


图3.对 EF 的影响随 N 速率的增加而减小。(a) N 速率的 SHAP 相互作用值,表示在没有其他因素干扰的情况下对 EF 的影响。黑线表示窗口大小为 25、步长为 1 的移动平均值。彩色线和阴影区域表示回归线及其对应的 95% 置信区间。(b) 从我们的数据集计算出的 ΔEF,该数据集使用每个实验组的中位 N 速率作为代表性 N 速率。黑线表示步长为 25 kg N ha-1 yr-1、窗口大小为 50 kg N ha-1 yr-1 的移动平均值,不包括记录少于 2 条的窗口。(a, b) 中的两条垂直虚线表示 250 和 600 kg N ha-1 yr-1 的阈值。


图 4. 土壤pH值对EF的影响模式。(a)pH值的SHAP值的移动平均值;(b)三个区间内pH值和EF之间的线性回归:4.7 ≤pH ≤6.8、6.8 < pH< 7.3和7.3 ≤pH ≤8.7。


表1.四大区域主要影响因素SHAP平均值。


农业遥感与作物模型
专注农业遥感、作物模型和农田环境等领域。
 最新文章