随着气候变化的影响愈发明显,人们对精确预测气候变化的需求也日益迫切。传统的气候模型通常依赖于物理过程的复杂计算和参数化,但在极端天气事件和长期预测等方面存在精度和计算成本的限制。机器学习(ML)的崛起为这一领域带来了新的希望:ML技术不仅能够处理大规模数据,还可以通过数据驱动的方法在复杂系统中发现潜在规律。本文提出将ML融入地球系统模型(ESM)中,以应对气候建模中的诸多挑战,并推动生成“地球数字孪生”——一个精准模拟地球系统的实时模型。
2024年8月23日,Veronika Eyring等人发表在《nature climate change》上的题为“Pushing the frontiers in climate modelling and analysis with machine learning”的文章,讨论了利用机器学习(ML)技术改进气候模拟和分析的可能性,并提出了四个关键领域:混合地球系统模型、极端事件检测与归因、气候模型分析和基准测试以及跨学科ML方法的发展。在混合地球系统模型方面,文章提到利用ML技术解决大气、海洋和陆地组件中的物理过程和不确定性问题。在极端事件检测与归因方面,文章强调了ML技术在快速搜索和识别极端天气现象方面的潜力。在气候模型分析和基准测试方面,文章探讨了如何使用ML技术加速气候模型的开发和评估。最后,在跨学科ML方法的发展方面,文章提到了开放数据和源代码的重要性,以及政府机构和私营企业之间的合作。
ML用于气候建模和分析
ML具有极大的潜力,可以很大程度提高我们对地球系统的了解,并减少气候预估中的不确定性。通过ML增强气候建模和分析的关键方法,特别是混合地球系统建模、气候模式模拟仿真、极端事件检测和归因以及气候模式分析和基准。
混合地球系统模拟:
将ML方法结合并集成到经典气候模型中的方法,即所谓的混合模型,已被提出能够解决经典气候模型面临的许多长期存在的系统偏差和挑战。基于机器学习的混合建模和亚网格尺度参数化已经针对不同的地球系统组成部分进行了开发,在大气、海洋和陆地方面已经取得了初步的有希望的结果。
在气候变化的背景下捕捉陆地上的极端事件是一个高度优先事项,数据的可用性、稀疏性和观测的不确定性仍然是陆地模拟的持续问题,陆地数据集之间的差异、不平等的地理分布以及观测中的空间和气候偏差是大规模使用数据的主要挑战,可能会使检索结果产生偏差。
混合建模也带来了新的挑战,例如耦合后的稳定性,当这些模型是针对当前气候而不是未来气候进行训练时,它们是否能够准确地预测变暖和极端天气,因此需要了解模型何时出现分歧和失败,并采取纠正措施,需要更全面地检测、分析和度量它们在气候外的泛化和超越时间平均误差(例如,在极端情况下)的表现。
模拟气候模型
在气候模拟方面,仍然存在许多挑战,包括模式误差与分辨率的关系以及气候系统内部变率对近期可预测性的限制。用ML模拟气候模型已经证明了加速解决这些挑战的潜力,因此已成为一个快速发展的领域,这些算法旨在以其成本的一小部分模拟基于物理的天气或气候模型。
使用模拟器生成大量的天气预报和气候预测集合,以更好地捕获内部变化,用模拟器生成的更大的集合能够捕捉到这种非常罕见的事件。模拟器还可以用来回答需要运行许多气候模型模拟的科学问题,需要系统地检查仿真器是否尊重主机物理模型的物理响应和统计数据。在模拟之外,气候模型和观测已经通过一种称为迁移学习的技术进行了最佳融合,以更好地预测气候变化,迁移学习可以通过减少系统误差和增加与近期气候记录中关键观测值的相关性来提高过去到未来的气候预测和预测的准确性。
极端事件检测与归因
ML在解决极端事件的挑战方面表现出相当大的希望,深度学习方法使训练算法能够以百亿亿次的速度发现和跟踪气候模型输出中的极端情况,机器学习方法已成功用于研究各种恶劣天气,它的某些应用已经显示出从当前到未来气候条件的泛化能力,ML算法也被用来模拟经典的降尺度方法,以提高气候模式模拟的水平空间分辨率,ML方法还可以加快对温暖气候极端事件的预测。
气候模式分析和基准
基于ML的参数化在评估中表现良好,如果它们尚未在线耦合到主机ESM中,而是在高分辨率模型数据上进行训练、验证和离线测试,则在气候模型中在线耦合时可能会表现出令人惊讶的失效模式。随着ML用于气候建模工作的成熟,社区已经认识到越来越需要开发指标、数据集和工具,以更严格和一致的方式对ML性能进行基准测试,并以数据为中心的人工智能,专注于通过识别提高训练数据质量和多样性的方法来改进机器学习结果。机器学习方法被用于约束基于过程分析和因果发现的多模型预测中的不确定性,或在全球尺度上结合紧急约束,以减少区域尺度上的不确定性。
ML 方法开发中的交叉挑战
用ML解决气候建模和分析中的关键挑战不仅受益于当前ML方法的应用,而且还需要解决所有这些不同应用共享的ML方法开发中的几个挑战。
物理一致性和泛化
机器学习模型在对分布外的样本进行测试时,可能会做出不一致的预测。降低基于机器学习的推理质量对数据变化的敏感性,这被广泛地称为鲁棒性,在异常值和极值上的性能可以使用自定义损失来提高极值的权重,而不影响平均值预测,或者使用极值理论对数据进行规范化的自定义框架,将鲁棒性测试作为天气和气候基准数据集的标准组成部分,将有助于在不同情况下建立最通用的ML框架,为其在气候科学中的常规使用铺平道路。
不确定度量化
机器学习领域需要解决的另一个挑战是模型预测性能的不确定性量化,ML模型本身的选择以及其预测的可变性存在随机不确定性,不确定性量化对气候预测提出了独特的挑战。在天由于ML模型本身的选择以及其预测的可变性气预报方面,集合预报取得了很大进展,从而提高了预报技能和更可靠的概率估计,对于气候预估,尽管在多模式组合中努力量化系统的不确定性,但系统的多尺度性质及其内部变率使得产生和验证可靠的不确定性估计和风险评估具有挑战性。
可解释的人工智能
XAI方法开始越来越频繁地出现在ML气候研究中,包括用于确定气候系统内可预测性的来源和分析气候变化的物理影响,XAI方法可用于确保神经网络模型在物理上与气候系统的真实动态相一致,这样的模型解释和可视化可以帮助机器学习方法捕捉问题的物理显著方面,在训练数据的限制内操作,并帮助识别新的科学假设。
因果推理
标准的机器学习方法,包括深度学习,擅长于从复杂的大规模数据集中学习高度非线性的统计关系,气候科学的研究问题往往是关于因果关系,而不是纯粹的统计关联。因果推理利用关于底层系统的假设从数据中回答因果问题提供了理论基础,因果推理很好地补充了机器学习,因果方法已在气候科学的各种背景下使用。
因果推理目前用于解决气候建模和分析中的两个主要挑战。首先,因果模型可以为混合模型中的亚网格尺度参数化提供信息,以更好地尊重ML模型中的潜在物理过程,其次还可用于评估和比较CMIP等项目的气候模式输出,可能对减少气候预估的不确定性产生影响,因果方法的主要优势在于对因果图的直观解释,陈述假设的透明方式,这增加了气候变化预测的可信度。
未来之路
创新的机器学习方法正在迅速为气候变化建模和预测以及从海量数据中提取信息提供新的变革性方法。将基于机器学习的混合esm与经典气候模型进行比较,以评估潜在的改进,并利用基于机器学习的非线性多变量和迁移学习与其他方法相结合,约束地球观测气候预测中的不确定性,这将是非常重要的。利用机器学习来更好地理解、建模和预测地球系统是一个具有挑战性但有前途的研究领域。
原文链接:
https://www.nature.com/articles/s41558-024-02095-y