中科院“苍龙”模型(CAS-Canglong):预测海温

文摘   2024-10-12 18:30   加拿大  
关注地球与工智能设置EarthAi星标

https://arxiv.org/abs/2409.05369

本研究是介绍了“苍龙”模型,主要用于预测海温。作者是来自中国科学院、美国太平洋西北国家实验室、澳大利亚联邦科学与工业研究组织、加州大学欧文分校和中国应急管理部国家自然灾害研究所的研究人员。第一作者是来自中国科学院地理科学与资源研究所的博士生王龙浩。

摘要: 文章介绍了一个名为CAS-Canglong的新型三维深度学习神经网络模型,用于预测全球海表面温度(SST)的亚季节到季节(S2S)时间尺度。这个模型对于干旱和洪水预测以及提高人类社会的灾害准备至关重要。与传统的基于物理的数值模型相比,CAS-Canglong在计算效率和预测能力上有显著提升,能够在一到三个月的预测期内提高七个关键海洋区域的海表面温度预测技能,提升幅度在13.7%到77.1%之间。

1. 引言: S2S预测是天气-气候联系中的一个重要挑战。准确的全球海表面温度(SST)预测对于提高S2S天气和气候事件的预测技能至关重要。然而,由于海-气相互作用和与大尺度大气环流相关的大气过程的表示不足,导致模型存在较大偏差。深度学习(DL)模型利用高维和长时间尺度的多变量数据,通过从历史观测中学习模式和内在物理关系来预测SST。

2. 结果:

  • • 2.1 回溯比较:CAS-Canglong模型与ECMWF S2S模型集合和北美多模型集合(NMME)的预测进行了比较。CAS-Canglong在空间分辨率和预测误差方面都优于物理模型。

  • • 2.2 主要区域的回溯:CAS-Canglong模型在七个关键SST区域和相关指数的预测中表现出强大的预测能力,包括Niño 3.4、北极振荡(AO)、太平洋年代际振荡(PDO)、暖池(WP)、印度洋偶极(IOD)、南大西洋(SAO)、南印度洋(SIO)和南太平洋(SPO)。

  • • 2.3 近实时预测:CAS-Canglong模型成功预测了2024年Niño 3.4区域的SST异常,与最新的ERA5观测数据相比,预测准确性高于ECMWF S2S模型。

3. 讨论: 文章讨论了S2S预测对于提前预警和准备重大极端天气和气候事件的重要性。CAS-Canglong模型通过有效预测SST,可能实现对极端事件的早期预警。

4. 方法:

  • • 4.1 数据:研究使用了ERA5再分析数据集,这是一个高分辨率的全球天气和气候数据集。

  • • 4.2 CAS-Canglong模型开发:模型采用了Swin-Transformer架构和独特的自注意力机制,以提高长期建模和预测能力。

  • • 4.3 训练方法:模型使用多种损失函数进行训练,以平衡短期和长期预测的准确性。

  • • 4.4 SST区域和相关气候指数:使用了多个观测的SST和相关指数进行模型评估。

  • • 4.5 评估指标:使用了均方根误差(RMSE)和相关技能(R)来评估模型性能。

数据可用性: 研究中使用的数据可以从Copernicus Climate Data Store下载,研究产生的数据可以从Figshare存储库下载。

代码可用性: 基于Python PyTorch的代码基于Swin-transformer代码库,训练好的模型、推理代码和模型细节已发布在GitHub存储库。

模型架构

这篇文章中提到的CAS-Canglong模型与其他模型相比,有哪些具体的优势?

CAS-Canglong模型与其他模型相比,具有以下几个具体的优势:

  1. 1. 计算效率:CAS-Canglong模型展示了显著的计算效率。与传统的基于物理的数值模型相比,它在预测全球海表面温度(SST)模式时需要的计算资源更少,同时保持或提高了预测的准确性。

  2. 2. 预测能力:该模型在一到三个月的预测期内,能够在七个关键海洋区域提高海表面温度预测技能,提升幅度在13.7%到77.1%之间。这表明CAS-Canglong在短期到中期的预测中具有较高的准确性。

  3. 3. 三维深度学习架构:CAS-Canglong是一个真正的三维模型,它在空间和时间上都考虑了预测因子,这使得模型能够捕捉和模拟复杂的海洋-大气相互作用。

  4. 4. 自注意力机制:模型采用了自注意力机制,这是一种深度学习技术,可以使模型在处理大量时空数据时更加灵活和准确。这种机制有助于模型识别和强调对预测最重要的数据模式。

  5. 5. 多变量关系建立:CAS-Canglong通过其基于Transformer的架构,建立了多个海洋和大气变量之间的关系,这有助于提高对SST季节性周期、异常和基于SST的气候指数的预测能力。

  6. 6. 回溯和近实时预测:模型不仅在历史数据的回溯测试中表现出色,还在近实时预测中显示出了高效的预测性能,这意味着它可以用于实际的气候预测和灾害早期预警。

  7. 7. 适用性:CAS-Canglong模型可以应用于其他亚季节地球系统天气预测任务,表明它具有成为地球科学领域通用标准深度学习模型的潜力。

  8. 8. 模型灵活性:模型支持迁移学习,这意味着它可以针对不同的海温区域进行调整,通过使用特定区域的数据来微调预训练模型,增强了其在不同地理设置中的实用性。

  9. 9. 集成预测:通过训练多个具有不同初始化参数的相同模型,可以进行集成预测,这有助于通过平均个别模型的偏差和方差来提高预测的可靠性和准确性。

如何评估CAS-Canglong模型的长期预测效果?

CAS-Canglong模型的长期预测效果可以通过以下几个方面进行评估:

  1. 1. 损失函数:模型训练时使用了两种损失函数,均方误差(MSE)和相关损失(Lcorr)。MSE专注于模型在短期内对海表面温度(SST)数据的解释能力,而Lcorr则特别惩罚长期预测中实际与预测的SST值之间的皮尔逊相关系数低于0.5的情况。这种组合损失函数有助于平衡模型在短期和长期预测中的准确性。

  2. 2. 预测技能指标:使用均方根误差(RMSE)和相关系数(R)作为评估指标。RMSE衡量模型预测值与实际观测值之间的差异,而相关系数衡量预测值与实际值之间的线性关系强度。这两个指标可以帮助评估模型在长期预测中的准确性和可靠性。

  3. 3. 回溯测试:通过与ERA5再分析数据集的比较,模型在2009-2022年的测试期间对SST和相关气候指数进行了预测。模型预测的Niño 3.4指数与ERA5数据的一致性,以及对ENSO事件的预测准确率,都是评估长期预测效果的重要指标。

  4. 4. 近实时预测:模型对2024年Niño 3.4区域的SST异常进行了预测,并与最新的ERA5观测数据进行了比较。这种近实时预测测试可以评估模型在实际应用中的长期预测能力。

  5. 5. 集合预测:通过训练多个具有不同初始化参数的相同模型,可以进行集成预测。集成预测通过平均多个模型的输出来减少个别模型的偏差和方差,从而提高长期预测的可靠性。

  6. 6. 与现有模型的比较:将CAS-Canglong模型的预测结果与现有的物理模型(如ECMWF S2S模型)和统计模型的预测结果进行比较,可以进一步评估其长期预测效果。

  7. 7. 预测的连续性和稳定性:评估模型在长时间跨度内的预测连续性和稳定性,检查模型是否能够维持一致的预测性能,而不是在某些时间段内表现良好而在其他时间段内表现不佳。

  8. 8. 预测的可解释性:评估模型预测的可解释性,即模型是否能够提供对预测结果背后的物理过程和动态的理解,这对于长期预测尤其重要。

通过这些方法,研究人员可以全面评估CAS-Canglong模型在长期预测中的性能,并确定其在实际气候预测和灾害预警中的应用潜力。

解读:kimi

加微信交流群,请备注:姓名-行业-单位)



声明:本公众号分享的资源均来自于互联网的公开资源,仅供个人学习和研究使用,不代表本人对其版权、真实性、合法性、准确性等方面做出任何保证。任何使用本号分享的资源的个人或组织,需自行承担相应的法律责任和后果;本号不承担任何法律责任和连带责任。使用本号分享的资源即代表您已完全了解并同意本免责声明的所有内容。






上海位温信息科技有限公司

专业的商业气象服务商



(咨询数据详情,可添加微信,请备注:合规数据



可提供气象产品 

  • 全国三千多个基准站

3213 个主要城市站点、每小时发 布 1 次,

每天发布 24 次,每次提供当前整点时刻的

城市站点实况天气(实况产品会在整点后

15 分钟、20 分钟、30 分钟进行数据更新),

要素包括:天气现象、气温、体感温度、风速、

风力、风向、相对湿度、气压、1小时降水量、

10分钟降水量、能见度、日出时间、日落时间、

紫外辐射等要素。

  • 探空气象站

  • 海洋气象站

  • 雷达拼图

  • 卫星云图(风云4、葵花8)

  • 格点实况、再分析资料

  • 数值预报:CMA EC GFS

  • 强对流天气预报

  • 强天气落区预报

    强对流天气(短时强降水/冰雹/雷暴大风)概率预报图

  • 台风、热带气旋

可提供国内与国外各类气象咨询气象服务

本公司提供服务稳定可靠,您值得拥有。




EarthAi
AI4Earth、人工智能、气象数值预报、学术论文!产业资讯等等……
 最新文章