NeuralGCM: 一种融合机器学习与物理原理来模拟地球大气的新方法

文摘   2024-08-22 10:03   北京  
点击下面卡片,快速关注本公众号

地球正在以前所未有的方式变暖,但气温升高对地球的未来意味着什么尚不完全清楚。全球哪些地区将面临长期干旱?大型热带风暴将在哪里使沿海洪水更加频繁?随着气温升高,野火季节将如何变化?为了回答这些和其他相关问题,科学家需要能够准确预测地球气候。

使用传统大气环流模型 (GCMs) 求解地球大气方程是天气和气候预测的基础 。在过去70年里,GCMs通过采用更好的数值方法和更详细的物理模型,同时利用更快的计算机以更高的分辨率运行,一直在稳步优化。在GCMs内部,云、辐射和降水等未解决的物理过程由半经验参数化表示。然而,调整GCMs以匹配历史数据仍然是一个手动过程,并且GCMs存在许多持续的错误和偏差。减少长期气候预测中的不确定性和预测极端天气事件的分布的难度对气候缓解和适应提出了重大挑战。

机器学习的最新进展为天气预报提供了一种替代方案。这些模型完全依赖于机器学习技术,使用来自欧洲中期天气预报中心 (ECMWF) 再分析数据集v5 (ERA5)的大约40年的历史数据进行模型训练和预测初始化。机器学习方法取得了显著的成功,展示了1到10天天气预报的确定性预报,而计算成本仅为传统数值预报模型的一小部分。机器学习大气模型所需的代码也少得多,例如GraphCast仅有5417 行,而NOAA的FV3大气模型有376578行。

与GCMs相比,机器学习方法具有明显的局限性。现有的人工智能机器学习模型专注于确定性预测,并且在训练的总体指标方面超越了确定性数值天气预报。然而,它们不会产生经过校准的不确定性估计,这对于有用的天气预报却至关重要。使用均方误差损失的确定性机器学习模型因对不确定性进行平均而获得奖励,当针对多日预报进行优化时,会产生不切实际的模糊预测。与物理模型不同,机器学习模型会错误地表示派生的(诊断)变量,例如地转风。此外,尽管在较长的时间尺度上使用机器学习方法取得了一些成功,但这些模型并未表现出超越现有传统GCMs的能力。

将GCMs与机器学习相结合的混合模型,是近期的发展趋势,因为它们建立在传统大气模型的可解释性、可扩展性和成功记录之上。在混合模型方法中,机器学习组件替换或纠正了GCMs的传统物理参数化方案。到目前为止,此类模型中的机器学习组件已经通过“离线”训练,通过独立于其与动力学相互作用学习参数化方案。然后将这些组件插入现有的GCMs。训练期间机器学习组件与控制方程之间缺乏耦合可能会导致严重问题,例如不稳定性和气候漂移。到目前为止,混合模型大多局限于理想化场景。在现实条件下,机器学习校正减少了非常粗糙的GCMs的一些偏差,但性能仍然比最先进的数值预报模型差很多。


这种方法比现有模型更快、计算成本更低、更准确。NeuralGCM是与欧洲中期天气预报中心 (ECMWF) 合作开发的,它将传统的基于物理的建模与机器学习相结合,以提高模拟的准确性和效率。这种方法可以生成2-15天的天气预报,比目前基于物理的黄金标准模型更准确,并且比传统大气模型更准确地再现了过去40年的大气温度。虽然尚未将NeuralGCM构建成完整的气候模型,但它标志着我们朝着开发更强大、更易用的气候模型迈出了重要一步。作者希望它最终能够让我们更准确、更切实地了解气候变化。

NeuralGCM 将传统的流体动力学求解器与用于小规模物理的神经网络相结合。这些组件由微分方程求解器组合,使系统按时间顺序向前推进。

与传统模型一样,NeuralGCM 将地球大气层划分成立方体,并对空气和水分运动等大规模过程的物理特性进行计算。但它并不依赖科学家制定的参数化来模拟云层形成等小规模方面,而是使用神经网络从现有天气数据中学习这些事件的物理特性。

NeuralGCM模拟了2019年12月26日至2020年1月8日14天内的湿度模式。湿度值越高,颜色越浅。

NeuralGCM 的一项关键创新是JAX中从头开始重写了大规模过程的数值求解器。这使得用户能够使用基于梯度的优化来“在线”调整耦合系统在许多时间步骤中的行为。相比之下,之前使用机器学习增强气候模型的尝试在数值稳定性方面遇到了很大困难,因为它们使用了“离线”训练,这忽略了随着时间的推移而积累的小规模和大规模过程之间的关键反馈。在 JAX 中编写整个模型的另一个好处是,它可以在TPU和GPU上高效运行,而传统的气候模型主要在CPU上运行。

比较NeuralGCM和AMIP在预测1980年至2020年期间1000hPa全球平均气温方面的表现。全球平均气温 (C) 来自 ECMWF ERA5数据集。

NeuralGCM预测了2020年全球热带气旋的路径。预测的风暴与ECMWF ERA5再分析数据集中显示的当年实际气旋的数量和强度相匹配。
NeuralGCM的计算速度也比传统的基于物理的气候模型快几个数量级,计算成本也更低。分辨率为1.4°的NeuralGCM模型比NOAA X-SHiELD快 3500倍以上,这意味着如果研究人员使用X-SHiELD模拟一年的大气,需要20天,而使用NeuralGCM只需8分钟。科学家只需要一台带有单个TPU的计算机即可运行NeuralGCM,但他们却需要请求访问具有13000个 CPU的超级计算机才能运行X-SHiELD。总体而言,使用NeuralGCM进行气候模拟的计算成本比使用X-SHiELD低十万倍,速度的提升相当于高性能计算 25年的进步。

NeuralGCM目前仅模拟地球大气层。后续工作中,研究团队将会把地球气候系统的其他方面(例如海洋和碳循环)纳入到模型中,使我们能够探索诸如厄尔尼诺-南方涛动等现象,特别是其可预测性和可变性。同时,NeuralGCM也将能够进行更长时间尺度的预测,而不仅仅是预测几天和几周的天气,而是预测气候时间尺度的天气。

研究团队开源了NeuralGCM代码和训练出的模型权重参数。

论文地址:https://www.nature.com/articles/s41586-024-07744-y

开源代码:https://github.com/google-research/neuralgcm




本公众号相关内容推荐


气python风雨
主要发一些涉及大气科学的Python文章与个人学习备忘录
 最新文章