ClimDetect:气候变化检测与归因的基准数据集

文摘   2024-10-14 23:36   湖南  
关注地球与工智能设置EarthAi星标

ClimDetect:气候变化检测与归因的基准数据集

https://arxiv.org/abs/2408.15993

作者与单位信息

本文的作者包括Sungduk Yu、Brian L. White、Anahita Bhiwandiwalla、Musashi Hinck、Matthew Lyle Olson、Tung Nguyen和Vasudev Lal,他们分别来自Intel Labs、北卡罗来纳大学教堂山分校(UNC Chapel Hill)和加州大学洛杉矶分校(UCLA)。这些作者代表了工业界和学术界在气候科学和人工智能领域的交叉合作。

研究背景

气候变化是21世纪最紧迫的环境挑战之一。全球变暖的人为因素,尤其是温室气体排放,已被广泛认为是导致全球温度上升的主要原因。为了制定有效的缓解和适应策略,理解这些变化的驱动因素至关重要。在气候科学中,检测和归因(Detection and Attribution,简称D&A)方法的发展是一个关键挑战,其目的是区分人为引起的变暖和自然气候变异性。

传统的气候D&A方法依赖于统计方法来识别气候“指纹”,即可以归因于外部强迫(如温室气体排放)的气候响应变量中的模式。然而,这些方法在处理大型空间数据集时面临挑战,因为它们需要识别复杂的模式。深度学习提供了一种潜在的工具,能够识别这些复杂模式,但缺乏标准化协议阻碍了跨研究的一致比较。

研究意义

本文介绍了ClimDetect,这是一个标准化的数据集,包含超过816,000个每日气候快照,旨在提高模型在识别气候变化信号方面的准确性。ClimDetect整合了过去研究中使用的各种输入和目标变量,确保了可比性和一致性。此外,研究还探索了视觉变换器(Vision Transformers,简称ViT)在气候数据中的应用,这是一种新颖且现代化的方法。

通过提供开放访问的ClimDetect数据集和相关分析代码,本工作为未来研究设定了一个基准,鼓励气候科学界探索多样化的建模技术。使用ClimDetect,科学家可以更清晰地洞察气候动态,支持全球努力应对这一重大挑战。

研究方法和数据

ClimDetect数据集结合了来自耦合模型比较计划第六阶段(Coupled Model Intercomparison Project Phase 6,简称CMIP6)模型集合的超过816,000个每日快照的历史和未来气候情景。这些数据由主题专家精心策划,以促进开发能够在日常天气模式中检测气候变化信号的模型。ClimDetect的目标是通过标准化气候指纹的输入和目标变量,解决以往研究中的碎片化问题,促进D&A研究工作的一致性和可比性。

研究还将现代机器学习架构,即视觉变换器(ViT),纳入气候科学。ViT在自然图像任务中表现出色,并在本研究中被适应用于分析空间气候数据。

数据集的输入是一个三维矩阵X,尺寸为64×128×3,代表64×128的纬度和经度网格,三个通道分别对应表面2米温度(tas)、表面2米比湿(huss)和总降水量(pr)。模型处理这些输入,预测标量结果AGMT,即年全球平均气温。

研究结论

ClimDetect数据集的基准实验旨在全面评估使用不同组合的气候变量预测AGMT的有效性。主要实验“tas-huss-pr”使用ClimDetect的所有三个变量——表面温度、表面湿度和总降水率——作为输入来估计AGMT。此外,还进行了补充实验,探索单个变量的预测效用。

研究结果表明,ViT模型在涉及多个变量的实验中,如tas-huss-pr和tas-huss-pr_mr,一致性地优于MLP和Ridge回归等简单模型。这些结果表明,ViT可能更适合模拟多个气候变量背后的复杂和高阶相互作用。

在移除平均信号(mean-removed experiments)的实验中,所有模型都面临更大的挑战,这反映了在没有平均残差信号提供的数据的情况下进行预测的难度增加。尽管如此,ViT仍然保持了相对较强的性能,表明它们能够有效地利用空间异常。

这些发现强调了ViT在未来的气候检测和归因研究中的潜力,特别是在利用多个变量和复杂数据配置的场景中。尽管如此,模型的选择仍应考虑特定的实验要求和数据特征。

研究限制和未来工作

ClimDetect旨在提供一个标准化的数据集,用于生成气候变化指纹,有效地利用广泛的变量来增强模型训练和分析。为了进一步扩展其适用性和稳健性,计划引入“ClimDetect-Obs”,这是一个扩展,将纳入观测和再分析(即观测混合模型输出)数据集。

虽然本文的研究并非主要关注点,但作者承认直接比较视觉变换器(ViTs)的GradCAM可视化与线性模型系数的局限性。ViT的内在复杂性意味着GradCAM可能无法像线性模型那样充分反映其解释层。为了确立ViTs作为气候指纹工具的地位,需要进一步探索多样化的模型解释工具。

结论

本文介绍了ClimDetect数据集,这是一个旨在统一和增强以往气候变化检测和归因努力的标准化工具,使用一致的输入和输出变量、数据集以及来自CMIP6历史和ScenarioMIP实验的模型。这种协调增强了研究间的可比性和可重复性,同时关注对稳健气候建模至关重要的关键变量,如表面温度、湿度和降水。此外,本研究还扩展了气候科学的 方法工具包,包括一系列模型,包括ViT,以及传统的机器学习技术。这种多样化的模型测试了既定方法,并探索了优化机器学习架构以用于气候相关任务的潜力。ClimDetect数据集不仅推进了机器学习在气候科学中的整合,而且为未来的研究和政策制定奠定了基础,旨在有效应对全球气候变化挑战。

解读:Kimi

加微信交流群,请备注:姓名-行业-单位)



声明:本公众号分享的资源均来自于互联网的公开资源,仅供个人学习和研究使用,不代表本人对其版权、真实性、合法性、准确性等方面做出任何保证。任何使用本号分享的资源的个人或组织,需自行承担相应的法律责任和后果;本号不承担任何法律责任和连带责任。使用本号分享的资源即代表您已完全了解并同意本免责声明的所有内容。






上海位温信息科技有限公司

专业的商业气象服务商



(咨询数据详情,可添加微信,请备注:合规数据



可提供气象产品 

  • 全国三千多个基准站

3213 个主要城市站点、每小时发 布 1 次,

每天发布 24 次,每次提供当前整点时刻的

城市站点实况天气(实况产品会在整点后

15 分钟、20 分钟、30 分钟进行数据更新),

要素包括:天气现象、气温、体感温度、风速、

风力、风向、相对湿度、气压、1小时降水量、

10分钟降水量、能见度、日出时间、日落时间、

紫外辐射等要素。

  • 探空气象站

  • 海洋气象站

  • 雷达拼图

  • 卫星云图(风云4、葵花8)

  • 格点实况、再分析资料

  • 数值预报:CMA EC GFS

  • 强对流天气预报

  • 强天气落区预报

    强对流天气(短时强降水/冰雹/雷暴大风)概率预报图

  • 台风、热带气旋

可提供国内与国外各类气象咨询气象服务

本公司提供服务稳定可靠,您值得拥有。




EarthAi
AI4Earth、人工智能、气象数值预报、学术论文!产业资讯等等……
 最新文章