地球正在以前所未有的方式变暖,但气温升高对地球的未来意味着什么尚不完全清楚。全球哪些地区将面临长期干旱?大型热带风暴将在哪里使沿海洪水更加频繁?随着气温升高,野火季节将如何变化?为了回答这些和其他相关问题,科学家需要能够准确预测地球气候。
使用传统大气环流模型 (GCMs) 求解地球大气方程是天气和气候预测的基础 。在过去70年里,GCMs通过采用更好的数值方法和更详细的物理模型,同时利用更快的计算机以更高的分辨率运行,一直在稳步优化。在GCMs内部,云、辐射和降水等未解决的物理过程由半经验参数化表示。然而,调整GCMs以匹配历史数据仍然是一个手动过程,并且GCMs存在许多持续的错误和偏差。减少长期气候预测中的不确定性和预测极端天气事件的分布的难度对气候缓解和适应提出了重大挑战。
机器学习的最新进展为天气预报提供了一种替代方案。这些模型完全依赖于机器学习技术,使用来自欧洲中期天气预报中心 (ECMWF) 再分析数据集v5 (ERA5)的大约40年的历史数据进行模型训练和预测初始化。机器学习方法取得了显著的成功,展示了1到10天天气预报的确定性预报,而计算成本仅为传统数值预报模型的一小部分。机器学习大气模型所需的代码也少得多,例如GraphCast仅有5417 行,而NOAA的FV3大气模型有376578行。
与GCMs相比,机器学习方法具有明显的局限性。现有的人工智能机器学习模型专注于确定性预测,并且在训练的总体指标方面超越了确定性数值天气预报。然而,它们不会产生经过校准的不确定性估计,这对于有用的天气预报却至关重要。使用均方误差损失的确定性机器学习模型因对不确定性进行平均而获得奖励,当针对多日预报进行优化时,会产生不切实际的模糊预测。与物理模型不同,机器学习模型会错误地表示派生的(诊断)变量,例如地转风。此外,尽管在较长的时间尺度上使用机器学习方法取得了一些成功,但这些模型并未表现出超越现有传统GCMs的能力。
将GCMs与机器学习相结合的混合模型,是近期的发展趋势,因为它们建立在传统大气模型的可解释性、可扩展性和成功记录之上。在混合模型方法中,机器学习组件替换或纠正了GCMs的传统物理参数化方案。到目前为止,此类模型中的机器学习组件已经通过“离线”训练,通过独立于其与动力学相互作用学习参数化方案。然后将这些组件插入现有的GCMs。训练期间机器学习组件与控制方程之间缺乏耦合可能会导致严重问题,例如不稳定性和气候漂移。到目前为止,混合模型大多局限于理想化场景。在现实条件下,机器学习校正减少了非常粗糙的GCMs的一些偏差,但性能仍然比最先进的数值预报模型差很多。
这种方法比现有模型更快、计算成本更低、更准确。NeuralGCM是与欧洲中期天气预报中心 (ECMWF) 合作开发的,它将传统的基于物理的建模与机器学习相结合,以提高模拟的准确性和效率。这种方法可以生成2-15天的天气预报,比目前基于物理的黄金标准模型更准确,并且比传统大气模型更准确地再现了过去40年的大气温度。虽然尚未将NeuralGCM构建成完整的气候模型,但它标志着我们朝着开发更强大、更易用的气候模型迈出了重要一步。作者希望它最终能够让我们更准确、更切实地了解气候变化。
与传统模型一样,NeuralGCM 将地球大气层划分成立方体,并对空气和水分运动等大规模过程的物理特性进行计算。但它并不依赖科学家制定的参数化来模拟云层形成等小规模方面,而是使用神经网络从现有天气数据中学习这些事件的物理特性。
NeuralGCM 的一项关键创新是JAX中从头开始重写了大规模过程的数值求解器。这使得用户能够使用基于梯度的优化来“在线”调整耦合系统在许多时间步骤中的行为。相比之下,之前使用机器学习增强气候模型的尝试在数值稳定性方面遇到了很大困难,因为它们使用了“离线”训练,这忽略了随着时间的推移而积累的小规模和大规模过程之间的关键反馈。在 JAX 中编写整个模型的另一个好处是,它可以在TPU和GPU上高效运行,而传统的气候模型主要在CPU上运行。
比较NeuralGCM和AMIP在预测1980年至2020年期间1000hPa全球平均气温方面的表现。全球平均气温 (C) 来自 ECMWF ERA5数据集。
NeuralGCM目前仅模拟地球大气层。后续工作中,研究团队将会把地球气候系统的其他方面(例如海洋和碳循环)纳入到模型中,使我们能够探索诸如厄尔尼诺-南方涛动等现象,特别是其可预测性和可变性。同时,NeuralGCM也将能够进行更长时间尺度的预测,而不仅仅是预测几天和几周的天气,而是预测气候时间尺度的天气。
研究团队开源了NeuralGCM代码和训练出的模型权重参数。
开源代码:https://github.com/google-research/neuralgcm
本公众号相关内容推荐: