Nat. Commun. |基于深度学习的全球陆地蒸发混合模型

科技   2024-11-03 00:01   贵州  

0

1

文章导读

文章探讨了基于深度学习的全球陆地蒸发混合模型,旨在解决传统模型在估计全球蒸发(E)时存在的不确定性和局限性。首先,文章分析了陆地蒸发在全球水循环和气候系统中的关键作用,特别是在全球变暖加剧的背景下其对水资源、生态系统和极端气候事件的重要影响。为了更精确地模拟植物蒸腾压力(St),研究使用涡流协方差、液流数据和卫星观测数据训练深度学习模型,将新的St公式嵌入到基于过程的E模型中,形成混合模型。这种方法使模型在全球范围内对植物蒸腾过程中的非线性压力反应有了更好的表述。具体来说,文章回答了以下研究问题:

(1)陆地蒸发的气候作用和其重要性是什么?

(2)为什么现有全球蒸发估计方法存在不确定性?

(3)深度学习如何改进传统蒸发估计模型的局限性?

(4)混合模型在全球尺度上的性能表现和优势是什么?

0

2

文章摘要

陆地蒸发(E)是一个重要的气候变量,其变化受多种环境因素调控。植物叶片蒸发(或蒸腾作用,Et)的调节因素尤为复杂,但由于当前研究多基于局地观测,全球模型中通常假设这些相互作用为线性关系。为此,本研究利用涡流协方差数据、液流数据以及卫星观测训练深度学习算法,以模拟蒸腾压力(St),即 Et 与其理论最大值之间的减少幅度。随后,研究将新生成的 St 公式嵌入到基于过程的 E 模型中,从而构建了一个全球混合 E 模型。在此混合模型中,St 公式在日尺度上与宿主模型进行双向耦合。通过与实地数据及卫星代理数据的对比,研究表明该模型显著提升了全球 St 和 E 的估计精度。所提出的框架具有进一步扩展的潜力,可用于改进地球系统模型中 E 的估计,并深化对这一关键气候变量的理解。

0

3

研究结果

混合模型架构

这项该混合模型由两个核心组件构成:一个基于过程的主机模型和嵌入主机模型中用于表示特定过程的机器学习公式。基于过程的模型选用了阿姆斯特丹全球土地蒸发模型 (GLEAM)。GLEAM 模拟 E 为各组成部分的总和:植物蒸腾 (Et)、裸土蒸发 (Eb)、露天水蒸发 (Ew)、雪升华 (Es) 和拦截损失 (Ei)。利用基于 Priestley-Taylor 的 Ep 公式及其相应的蒸发应力因子(St 和 Sb),估算全球模型中各网格单元的 Et 和 Eb,并根据矮植被、高植被、裸土和开放水域分类(图1)。拦截过程的估算基于 Gash 分析模型。此外,GLEAM 包含一个多层土壤水平衡模型,能同化基于卫星的表层土壤湿度数据。Sb 作为土壤水分含量的函数,而 St 则解释了由于植物可用水(PAW)短缺和次优物候状态(由植被光学深度 VOD 表示)所引起的蒸腾胁迫。然而,在自然环境中,部分其他压力因素也会使 Et 降至其潜力以下,而这些因素未在基于过程的 GLEAM 的 St 公式中考虑。Et 对这些额外压力源的反应取决于特定生态系统特性,难以归纳为单一的压力因子 (St)。

本研究的目标是利用深度学习和可靠的现场观测,开发一个能够适当编码自然环境中多重压力源功能关系的 St 公式。深度学习模型基于涡流协方差或通量塔和液流测量网络的大量日尺度观测数据进行训练,分别针对矮植被(231 个通量塔,约173,000个数据点)和高植被(137 个通量塔和 90 个液流测量点,约125,000个数据点)进行建模(关于深度学习模型中使用的目标变量和协变量的详细信息,见方法部分)。除 PAW 和 VOD 外,研究还考量了其他四个已知会调节气孔导度并影响 St 的蒸腾压力源:(a) 水汽压不足 (VPD),作为大气干燥度的指标;(b) 气温 (Ta),包括次优温度和热应激的影响;(c) 入射短波辐射 (SWi),表示光限制的影响;以及 (d) 大气二氧化碳浓度,对气孔开口起到重要调节作用。研究注意到,限于训练算法的有限记录长度,可能无法充分捕捉因二氧化碳升高而导致的长期生态或植物性状适应对蒸腾作用的渐进性影响(如水利用效率的变化趋势)。因全球动态数据缺乏,本研究未考虑磷和氮限制对 St 的潜在影响。此外,由于缺乏可靠的全球数据,未明确考虑植物性状(如根深度、等水性及其他解剖和形态特性)及其精细尺度或种间差异在全球模型中的影响。

最终,通过结合基于深度学习的 St 模型和基于 GLEAM 过程的模型,研究构建了一个全球 E 的混合模型。在此全球模型的每个每日时间步长和每个 0.25 度网格单元上,GLEAM 的土壤水平衡模块首先利用降水量 (P) 计算 PAW。然后将 PAW、VOD、Ta、VPD、SWi 和 CO2 输入到已离线训练好的深度学习模型中。深度学习模型运行在预测模式下生成 St,随后通过主机模型的过程公式约束 Ep,以计算 E。在下一时间步重复该过程前,E 用于更新土壤湿度和 PAW(图1)。

图1|混合模型架构。混合陆地蒸发模型的示意图,包括表示子网格异质性以及深度学习模型和混合模型的足迹差异。  Ei 为拦截量,Ep 为潜在蒸发量,S 为蒸发胁迫因子,St 为蒸腾胁迫,E 为实际蒸发量,P 为降水量,Rn 为净辐射量,Ta 为气温,VOD 为植被光学深度,VPD 为水汽压 赤字,SWi 是传入的短波辐射,CO2 是二氧化碳。红色箭头表示基于处理的模型独有的建模步骤,绿色箭头是混合中添加的步骤,黑色箭头是两个模型共同的步骤

通过现场测量进行验证

混合模型的 St 和 E 估计在来自多个通量塔和液流数据库的 458 个原位监测站上进行了验证。通过将混合模型与完全基于过程的模型进行性能比较,并使用小提琴图和空间图显示克林-古普塔效率 (KGE),研究全面评估了模型的精度。KGE 是一种综合度量方法,结合了相关性、变异性偏差和平均偏差。理论上,KGE 值范围为 −∞ 到 1.0,当值高于 -0.41 时,模型预测优于平均季节周期。

小提琴图(图2a)显示了矮植被生态系统(231 个站点)和高植被生态系统(227 个站点)中各站点的 KGE 分布。结果显示,基于过程的模型和混合模型均能准确估算矮植被生态系统(农田、灌木、草原和湿地)及高植被生态系统(阔叶林、针叶林和混交林)中的 St。对于大部分站点(>75%),基于过程的模型的 KGE 值高于 -0.41。然而,深度学习的 St 模型在高大植被区域明显提升了 KGE 值(图 2a),这主要归因于模型在偏差和变异性方面的改善,而非相关性方面的变化。虽然基于过程的 St 模型和混合模型的平均相关性相近,但混合模型的 RMSE 明显较低,特别是在高大植被生态系统中。

研究进一步考察了混合模型中 St 估计的改进对 E 模拟的传播效果。图2b显示出 St 的改进并未线性传递至 E,主要是因为大多数通量塔和液流站点位于能量受限区,Ep 的影响大于 St 对 E 动力学的作用。总体来看,两个模型对短植被的 KGE 值均较高且相近(中值约 0.5),但在高大植被上混合模型表现更优。相关性和 RMSE 方面,两模型的表现大体相似:基于过程的模型表现出稍高的相关性,但混合模型的 RMSE 在两种植被类别中均较低。

研究还将混合模型的 E 估计与纯机器学习数据集 FLUXCOM 进行了对比。结果表明,虽然两者的整体性能相似,但在高大植被(如森林)生态系统中,混合模型的表现优于 FLUXCOM。

为更全面理解混合模型与基于过程模型的差异,研究分析了不同地理区域 St 和 E 估计值的 KGE 差异分布(图3)。在拥有大量通量塔和液流点的北美(NA),混合模型在 St 和 E 的估算上优于基于过程的模型,尤其是在东部和东北部的湿润地区。然而,在西南干旱地区,两种模型对 St 的估计均存在偏差。在欧洲(EU)区域,混合模型在大多数通量塔站点上(包括干旱的南部区域)优于基于过程模型。而在亚洲(AS)和世界其他地区(RW),混合模型的表现与基于过程模型相似,这可能是由于 AS 和 RW 区域的通量塔和液流站点分布稀疏,生态系统的生物物理特性与训练数据集存在差异。

此外,研究还比较了相关性和 RMSE 的空间图,以探讨 KGE 值差异的来源。结果显示,两模型在相关性方面表现相似,表明混合模型的改进主要来源于变异性估计的提高。小提琴图也支持这一发现。然而,St 估计的改进在能量有限的区域(图3)并未显著改善 E 的估计,这些区域在训练数据中的表现不佳。

最后,研究还对比了混合模型与 FLUXCOM 在各通量塔和液流测量站点的性能,结果显示,混合模型在美国西部相对干旱区域及伊比利亚半岛上的表现不如 FLUXCOM,与基于过程模型的表现相似。

图2| 混合模型和基于过程的模型的现场验证。  a、b 小提琴图显示了针对所有通量塔和液流测量点计算的蒸腾应力因子 (St) 和蒸发量 (E) 的克林-古普塔效率 (KGE) 指标的分布。混合模型和基于过程的模型的 KGE 分布根据矮植被类型和高植被类型进行分类。虚线代表中位数(大虚线)和四分位数范围(小虚线)。红线代表 KGE 值为 -0.41,高于该值的模型预测或模拟被认为优于平均季节性周期。对于液流点,使用蒸腾估计值 (Et) 而不是 E

图3|混合模型和基于过程的模型的现场比较。地图显示了混合模型和基于过程的蒸腾胁迫因子 (St) 和蒸发 (E) 模型之间的克林-古普塔效率 (KGE) 指标的差异,这些模型是使用不同地理区域的通量塔和液流测量点的观测结果计算得出的 区域:北美 (NA)、亚洲 (AS)、欧洲 (EU)、世界其他地区 (RW)。蓝色(红色)色调表示与基于流程的对应模型相比,混合模型有所改进(退化)。对于液流点,使用蒸腾估计值 (Et) 而不是 E

与全球数据集的比较

混合模型的目标是生成整个大陆表面的 St 和 E 的空间和时间连续估计。为验证其准确性,研究将 St 和 E 的独立全球估计结果与其他全球数据集进行了比较(图4和图5),并通过每月时间序列的相关图分析时间动态(图6)。由于 St 在此尺度上的观测数据有限,研究使用已证明能良好代表植被蒸腾胁迫的卫星指标,即太阳诱导叶绿素荧光与光合有效辐射的比率(SIF/PAR)作为代理。虽然 SIF/PAR 值的单位和范围与 St 不同,但其空间梯度和时间动态被认为具有可比性。研究提示,极端条件和较高二氧化碳浓度下的比较可能不适用,因为碳和水循环可能会脱钩。

在北半球夏季6-8月(JJA),混合模型中 St 的空间分布与基于过程的模型相似(图4a, c),但混合模型更好地捕捉了高纬度地区较高的蒸腾压力(图4e)。12月-2月(DJF)期间也显示了类似的效果;混合模型准确捕捉了高纬度区域的 St 分布(图4b, d, f)。此外,混合模型有效表现了刚果、亚马逊和东亚雨林在 JJA 和 DJF 季节的胁迫(图4)。

图6a、c 显示了混合模型和基于过程的模型中 St 与 SIF/PAR 的时间对应关系,而图6e 表示二者的差异。混合模型在大部分大陆区域与 SIF/PAR 呈正相关,亚马逊、刚果和东南亚的部分地区除外(图6a)。相比之下,混合模型在中国东部和北纬地区的 St 表现出与 SIF/PAR 更高的相关性(图6a, c),而基于过程的模型在北美西部、欧洲和澳大利亚的相关性略高。此外,在 JJA 和 DJF 季节中,混合模型与 SIF/PAR 的空间相关性显著提升(0.66 对 0.59 以及 0.42 对 0.34)。

研究进一步将混合模型和基于过程模型的 E 估计值与纯机器学习生成的 E 数据集(FLUXCOM)进行比较,后者基于本研究使用的全球通量塔子集进行训练。结果显示,在 JJA 和 DJF 两个季节中,混合模型和基于过程模型的 E 空间分布模式与 FLUXCOM 相似(图5)。然而,在南美东北部以及非洲南部和东部区域,FLUXCOM 对 E 的估计值高于混合模型和基于过程模型,特别是在 JJA 期间。相关图(图6b, d)显示了混合模型 E 估计与 FLUXCOM 的高度对应性。

亚马逊地区是混合模型和基于过程模型中一个明显的分歧区域,这可能与该地区热带森林中的观测站点稀少有关,从而导致 FLUXCOM 和混合模型在热带森林中的估计不确定性更大。此外,这种不确定性也可能反映出 FLUXCOM 中对截获损失缺乏明确的考量作为 E 的组成部分。总体上,混合模型与 FLUXCOM 的相关性差异较小(图6f),但在 JJA(0.84 对 0.81)和 DJF(0.95 对 0.94)期间,混合模型显示出与 FLUXCOM 的空间相关性略有改善。

图4|模拟蒸腾胁迫的全球尺度评估。  6月-7月-8月(JJA)基于处理模型和混合模型的季节性平均蒸腾胁迫因子(St)以及太阳诱导叶绿素荧光和光合有效辐射(SIF/PAR)的比率(SIF/PAR)的比较a、c、e 以及 12 月 - 1 月 - 2 月 (DJF) b、d、f 季节。SIF 的测量单位为 mWm2/sr/nm,而 PAR 的测量单位为 W/m2

图5|模拟蒸发的全球尺度评估。基于处理的模型和混合模型的季节性蒸发总量 (E) 与直接基于 FLUXNET 站点蒸发作为 JJA a、c、e 和 DJF 的目标变量 (FLUXCOM) 进行训练的纯机器学习模型的比较 b、d、f 季节。E 的单位为毫米/月

图6|模拟蒸腾胁迫和蒸发与全球数据集的相关性。  a、c 比较基于处理的模型和具有观测 SIF/PAR 的混合模型之间蒸腾应激因子 (St) 的相关图。  b 和 d,基于处理的模型和基于机器学习估计的混合模型 (FLUXCOM) 之间蒸发 (E) 相关图的比较。  e:a、c 之间的差异。  f:b 和 d 之间的差异

0

4

讨论

随着地球系统和气候模型的规模不断扩大,其复杂性也不断提升,对计算资源的需求日益增加。更重要的是,许多过程基于有限的实验数据进行建模,因此在更大尺度上的应用通常伴有不确定性。混合建模方法有望缓解过度参数化的负面影响,减少计算时间,并提高模型的过程表达准确性。

本研究聚焦于全球水循环中的关键变量之一——陆地蒸发(E),并开发了 E 的全球混合模型。该模型将基于深度学习的蒸腾压力公式嵌入每日时间尺度的过程模型中。研究结果显示,基于专家知识、在无先验假设下设计的深度学习模型在捕捉蒸腾压力的非线性相互作用方面整体上优于传统的基于过程的模型。最大的改进出现在森林(尤其是北纬地区的高大植被)中,对于估算热带、温带和北方森林的蒸腾量具有重要意义,因为这些森林在全球蒸腾中占有主要份额。

此外,研究指出了深度学习模型的局限性:充足的训练数据至关重要,而现有的通量塔和液流测量站点主要集中在北美和欧洲。对于存在显著区域和局部变异的地球系统过程,缺乏全球范围的数据会限制数据驱动公式的推广能力。

0

5

原文信息

原文题目:

A deep learning-based hybrid model of global terrestrial evaporation

原文作者:

Koppa et al.

期刊名:

Nature Communications

发表时间:

2022.04

原文链接:

https://www.nature.com/articles/s41467-022-29543-7

    

生态遥感前沿
分享生态遥感领域实用教程、最新科研成果及资讯,交流、合作等事宜请加Novel_2020
 最新文章