Nature Water | 全球高分辨率总水储量异常:使用深度学习算法的自监督数据同化

文摘   2024-10-04 17:01   新加坡  
点击订阅公众号 | 前沿学术成果每日更新

           

第一作者:Junyang Gou

通讯作者:Junyang Gou

通讯单位:Institute of Geodesy and Photogrammetry, ETH Zurich, Zurich, Switzerland.

DOI10.1038/s44221-024-00194-w

                 

                 

                 

                 

                 

                 

     

             
图文速览

               
文字摘要:总水储量异常(TWSAs)描述了陆地水循环的变化,这对于理解我们的气候系统至关重要。该研究提出了一种带有新损失函数的自监督数据同化模型,以提供0.5°空间分辨率的全球TWSAs。该模型结合了水文模拟以及来自重力恢复与气候实验(GRACE)及其后续任务(GRACE-FO)卫星任务的测量数据。通过在小流域闭合水平衡方程,证明了高分辨率信息的效率,同时保留了从GRACE(-FO)测量中继承的大尺度精度。该产品有助于本地监测自然灾害,并显示出更好理解自然和人为活动对水循环影响的潜力。我们预期我们的方法通常适用于其他TWSA数据源,且结果产品对地球科学社区和社会具有重要价值。

               

               

               

               

               

               

               
研究背景
                   

自2002年以来,重力恢复和气候实验 (GRACE) 及其后续 (GRACE-FO) 任务(以下简称 GRACE)为我们提供了一个独特的机会,通过测量重力场变化来监测全球总水储量异常 (TWSA) 的变化。尽管 GRACE 产品已被广泛应用,但其约 3° 的粗空间分辨率是限制其在相关领域应用的关键因素之一。

近年来,深度学习技术迅速发展,在模拟地球系统方面表现出显著潜力。许多研究探索了在监督学习环境下应用深度学习或传统机器学习方法对GRACE(重力恢复与气候实验)测量数据进行降尺度(downscaled)处理的可能性。主要挑战是需要无法获取的高分辨率总水储量异常(TWSAs)真实数据。为解决这个问题,这些研究通常:

1. 通过将高分辨率水文模型模拟值下采样到与 GRACE 相同的分辨率来生成训练对;
2. 另外,就是在水文模拟上应用高斯平滑器生成类GRACE的TWSAs,并基于合成数据对训练模型。

该研究并解决了现有深度学习算法的两个不足,即减轻不同域之间的假设以及提供全球泛化能力(数据同化),为降尺度TWSA问题提供了贡献。该研究:
1. 首先开发了一种基于(1)特定区域内输出与GRACE TWSAs之间的平均偏差以及(2)特定区域内输出与WaterGAP Hydrology Model (WGHM) 之间的相似性的损失函数,使得网络参数可以以自监督的方式进行优化,而无需明确的假设来连接高低空间分辨率域或模拟测量域。
2. 提出基于卷积神经网络的原理的模型,可以考虑单个单元之间的空间相关性.

               

               

               

               

               

               

               
主要研究方法

                   

数据同化模型及损失函数设计

为了避免对输入输出对做出严格的假设并尽可能多地利用可用数据源中的信息,该文提出了一个数据同化模型,该模型具有专门设计的损失函数,允许自监督优化。该损失函数,设计总逻辑是将模型的输出与两个输入(GRACE TWSA 和 WGHM TWSA)进行比较:

  1. 首先最小化平均预测 TWSA与平均 GRACE TWSA的绝对误差 (AE);
  2. 使用皮尔逊相关系数 (R) 以及 预测的 TWSA 和WGHM TWSA 之间的平均绝对误差 (MAE)来表征模型输出和 WGHM TWSA 之间的相似性。

模型在某些层中使用卷积代替一般矩阵乘法,其中的卷积算子(通常称为核)可以通过考虑像素或低级特征之间的相对位置关系来提取高级特征图。模型中还应用了残差学习的概念,促进模型拟合和增加模型的拟合性能。整体如图1所示:

图1 总体模型结构 

模型整体分为编码器和解码器两部分。

编码器:包含三个2D卷积层(Conv2D),后跟 ReLU 激活函数和三个residual block。编码过程中,每个卷积层的stride为 2 ,减小输出的大小并增加感受野;卷积层的kernel尺寸为3X3,但数量越来越多(16、32 和 64)以增加潜在信息,即特征维度的数量。

解码器:首先使用 2D 双线性上采样层(2D-bilinear upsampling layers)对特征图进行预上采样(pre-upsample),然后将它们依次输入到 Conv2D、 ReLU 和residual block。与编码器的Conv2D不同的是,解码器中Conv2D的stride为 1,以保持输出大小不变;kernel数量分别为 64、32 和 16 个,用于从潜在信息中重现空间信息。在模型的最后,设计了另一个kernel大小为 1 且没有激活函数的卷积层,以便将最终的特征图投影到实际的 TWSA 值。最终得到的输出大小与输入大小相同(32×32)。生成输出后,将它们与原始 GRACE 和 WGHM TWSA 进行比较并计算损失。


               

               

               

               

               

               

               
主要结果

                   
全球的降尺度TWSAs产品的不确定性估计
为了提供不确定性信息,作者结合概率深度学习原理和蒙特卡洛模拟,使用深度集成估计不确定性。图2显示了高分辨率TWSA产品的示例,其中放大了六大主要河流流域。在全球范围内,水储量的季节性变化与 GRACE 测量观测到的变化一致。总体而言,降尺度的 TWSA 的全局中位不确定性为 7.3 毫米。水储量变化迅速的地区通常伴随着相对较大的不确定性,因为它们的 TWSA 值较高,例如图2所示的主流。
图2:2008年8月降尺度后的TWSA(上)及其不确定性(下)。数据以等效水高(EWH)的形式提供,空间分辨率为0.5°。a-f,展示了六个主要河流流域的放大细节:亚马逊(a)、密西西比(b)、刚果(c)、勒拿(d)、长江(e)和尼罗河(f)。没有有效信息的区域被阴影覆盖。请注意,为了更好地可视化,放大的图像采用了不同的空间比例尺。
 通过相关性分析实现具有大规模质量守恒的高分辨率细节

由于无法获得全球范围内精确的高分辨率 TWSA 测量数据,作者无法直接评估降尺度产品的质量。因此,作者依赖于不同背景下的 GRACE 测量和 WGHM 模拟,将整个时间跨度内的每个像素视为一个时间序列,并计算降尺度和 WGHM TWSA 之间逐像素的Pearson相关性。由于皮尔逊相关系数(Pearson correlation)对于尺度变化是不变的,因此在WGHM TWSAs中的不准确数值的影响被减小了。如图3a所示,整体相关性较高,相关性中值为 0.80,与 GRACE TWSA(0.53)相比提高了 51%

图3:2002年至2019年底降尺度后TWSA的评估。a,与WGHM模拟结果的全球像素级皮尔逊相关系数。b,与GRACE测量值相比的流域级均方根误差(RMSE)。没有有效信息的区域被阴影覆盖。
深度学习模型在预测流域尺度上长期趋势和季节性变化的表现
为了更详细地了解所提出的深度学习模型在流域尺度上的表现,我们绘制了六个选定主要流域的平均 TWSA 时间序列(图4)。在亚马逊河流域,主要的季节性信号相对同质。降尺度和 WGHM TWSA 都与 GRACE 测量结果高度吻合,尽管 WGHM 模拟往往低估了振幅。对于平均 TWSA 不太稳定且变化不均匀性较强的流域(密西西比河、刚果河、勒拿河和尼罗河),降尺度 TWSA 与 GRACE 观测的吻合度比 WGHM 模拟更高。

图4:2002年至2019年底研究期间六个选定的主要河流流域的平均TWSA时间序列(毫米)。a-f,亚马逊(a)、密西西比(b)、刚果(c)、勒拿(d)、长江(e)和尼罗河(f)。本文降尺度产品简称为DS。请注意,不同流域的y轴范围不同。

为了量化该方法在保留长期趋势、年信号和半年信号方面的性能,作者从三种TWSA类型中估计了160个面积大于200,000平方公里的流域中的这些信号,并在图5a中展示了结果。这里,作者将空间阈值设定为200,000平方公里,以获得更可靠的GRACE估算作为参考[16,39,43]。WGHM(水文模型)与GRACE(重力恢复和气候实验卫星)得出的趋势之间的相关性仅为0.47,这显示了水文模型在捕捉长期趋势方面的主要局限性。我们的方法显著改善了这一情况,达到了0.94的相关性。这种改进揭示了所提出的用于数据同化的算法的有效性。网络学会了依赖GRACE测量来校准超过GRACE有效分辨率的区域平均量级。因此,GRACE测量中包含的趋势已成功传递给了降尺度后的TWSA。

图5:160个面积大于200,000平方公里的流域信号的时间分解。a,从高分辨率产品(y轴)与GRACE测量值(x轴)中估计的长期趋势、年振幅和半年振幅。b,流域趋势差异图(降尺度后的GRACE)。c,流域相位偏移图(降尺度后的GRACE)。没有有效信息的区域被阴影覆盖。

 在GRACE卫星数据的有效分辨率之外,仍然能够确保水平衡方程的闭合

降尺度后的TWSA有助于在小于GRACE有效分辨率的区域更好地闭合水平衡方程。图6展示了从降尺度后的TWSA推断出的水量变化与根据ERA5-Land水分收支成分在四级流域中计算出的水量变化之间的吻合情况。降尺度后的TWSA在全球范围内显示出合理的能力来闭合水平衡方程

 图6:从降尺度后的TWSA推断出的总水储量变化与从水分收支成分计算出的变化之间的吻合情况。a,四级流域中降尺度后TWSA的流域级纳什-苏特克里夫效率(NSE)。没有有效信息的区域被阴影覆盖。b,按照流域面积(右轴)排序的降尺度TWSA与GRACE TWSA之间NSE的差异(左轴)。正值表示降尺度TWSA表现更好。c,与b相同,但与WGHM TWSA进行比较。
文献信息             
:5              

点击“原文链接”,查看论文         


               

               

声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!         

邮箱:environmodel@sina.com         

若您认为有用,欢迎

Environmodel设为星标,或

点击“在看”或“分享”给他人

Environmodel
Environmodel(环境模型)专注于环境科学与工程领域的建模及模型研究进展,并分享涵盖机器学习、深度学习以及人工智能等相关领域的理论知识、主流工具和Python编程技巧。
 最新文章