AI赋能天气：微软研究院发布首个大规模大气基础模型Aurora

科技 2024-06-20 17:32 北京

（本文阅读时间：7分钟）

编者按：气候变化日益加剧，高温、洪水、干旱，频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化，为政府、企业和公众提供更可靠的信息，以便做出及时的准备和响应。为了应对这一挑战，微软研究院开发了首个大规模大气基础模型 Aurora，其超高的预测准确率、效率及计算速度，实现了目前最先进天气预测系统性能的显著提升。Aurora 不仅在预测技术上取得了重大突破，更在应用层面展现出了巨大潜力。

2023年11月，风暴“夏兰”席卷了欧洲西北部，造成了严重破坏，伴随而来的低压系统刷新了英格兰的记录，成为极为罕见的气象事件。这场风暴的猛烈程度让许多人措手不及，在暴露当前天气预测模型不足的同时，也凸显了气候变化日益加剧的情况下，提升气候预测准确性的迫切需求。我们如何才能更好地预测此类极端天气事件，并做好更为充分的准备？

Charlton-Perez 等人（2024年）近期的一项研究指出，即便是目前最先进的人工智能天气预测模型，在准确捕捉风暴“夏兰”的快速增强过程及其峰值风速方面也面临着挑战。为应对这些挑战，微软研究院开发了先进的人工智能基础模型 Aurora，可以从海量的大气数据中洞察到有价值的信息。Aurora 所展示出的创新天气预测方法，有望显著提升人们预测并减轻极端天气事件影响的能力，包括对风暴“夏兰”这类恶劣天气事件的急剧恶化进行预测。

Aurora 论文：

Aurora: A Foundation Model of the Atmosphere

https://www.microsoft.com/en-us/research/publication/aurora-a-foundation-model-of-the-atmosphere/

灵活的大气三维基础模型

Aurora 的有效性在于它经过了超一百万小时的多样化天气和气候模拟的训练，能够全面了解大气动力学。这使得该模型在广泛的预测任务中都表现出色，即使在数据稀疏的地区或极端天气的情况下也能如此。通过以0.1°（赤道处约11公里）的高空间分辨率运行，Aurora 可以捕捉大气过程的复杂细节，提供比以往更准确的预报，而且其计算成本仅为传统数值天气预报系统的一小部分。据估计，Aurora 相较于最先进的数值预报系统（Integrated Forecasting System, IFS）可提升约5000倍的计算速度。

Aurora 不仅拥有极高的预报准确性和效率，还具有多功能性，可以预测各种大气变量，从温度和风速到空气污染水平和温室气体浓度。Aurora 的架构旨在处理异构的黄金标准输入，并以不同的分辨率和保真度生成预测。该模型由一个灵活的 3D Swin Transformer 和基于 Perceiver 的编码器和解码器组成，使其能够处理和预测一系列跨空间和压力水平的大气变量。通过对大量多样化数据进行预训练并针对特定任务进行微调，Aurora 学会了捕捉大气中的复杂模式和结构，即使在有限的训练数据下对特定任务进行微调时，它仍然能有出色的表现。

图1：Aurora 架构

大气化学和空气污染的快速预测

Aurora 多功能性的一个典型例子是其能够利用哥白尼大气监测服务（CAMS）的数据预测空气污染水平。这是一项众所周知的艰巨任务，因为大气化学、天气模式和人类活动之间复杂的相互作用，以及 CAMS 数据的高度异构性。通过利用灵活的编码器-解码器架构和注意力机制，Aurora 可以有效处理并学习这些具有挑战性的数据，捕捉空气污染物的独特特征及其与气象变量的关系。这使得 Aurora 能够在0.4°的空间分辨率下生成精确的五天全球空气污染预报，并在所有目标的74%中超越了最先进的大气化学模拟，从而证明了 Aurora 在解决各种环境预测问题方面的高度适应性和巨大潜力，即使在数据稀缺或高度复杂的情况下也是如此。

图2：Aurora 在许多目标上的表现都优于现行的 CAMS：(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较；(b) Aurora 相对于 CAMS 的纬度加权均方根误差（RMSE），负值（蓝色）表示 Aurora 的表现更佳

利用数据多样性与模型缩放改善大气预测

该研究的主要发现之一是，与在单一数据集上的训练相比，在多样化的数据集上进行预训练可以显著提升 Aurora 的性能。通过整合气候模拟、再分析产品及业务预报的数据，Aurora 能够学习到更强大、更通用的大气动力学表征。得益于庞大的规模和多样化的预训练数据，Aurora 可以在各种任务和分辨率上，超越目前最先进的数值天气预报模型和专业的深度学习方法。

图3：在不同数据上进行预训练并扩大模型规模均有助于提升性能

Aurora 模型的规模化直接带来了在架构设计、训练数据语料库以及预训练和微调协议方面的性能优势，使得 Aurora 的性能超过了现有的专业深度学习模型。为进一步验证在多个数据集上预训练大模型的优势，研究员们将 Aurora 与 GraphCast 进行了比较，后者仅在 ERA5 上进行了预训练，并被认为是分辨率为0.25°、交付时间长达五天的最先进的人工智能模型。此外，研究员们还将 IFS HRES（数值天气预报的黄金标准）也纳入了比较范围。结果表明，无论是在与气象分析、气象站观测数据还是极端值的对比中，Aurora 的表现均优于 GraphCast 和 IFS HRES。

图4：在绝大多数目标上，Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中，中心线右侧的值代表高于阈值的累积均方根误差，左侧的值表示低于阈值的累积均方根误差。

地球系统建模的范式转变

Aurora 的影响力远不止于大气预报领域。通过展示基础模型在地球科学中的潜力，该研究为开发覆盖整个地球系统的综合模型奠定了基础。基础模型可以在数据稀缺的情况下出色地完成下游任务，有望使得在数据稀缺地区（例如发展中国家和极地地区）的民众也能够更加平等地获取准确的天气和气候信息。同时，这一进展也将对农业、交通、能源开发以及灾害应对等多个领域产生深远影响，让人们能够更好地适应气候变化带来的挑战。

随着人工智能在环境预测领域的不断进步，微软研究院希望 Aurora 能够成为未来研究和发展的新范式。该研究强调了多样化预训练数据集、模型扩展和灵活架构在构建地球科学强大的基础模型时的重要性。随着计算资源和数据可用性的不断进步，可以预见，未来像 Aurora 这样的基础模型将成为天气和气候领域预测系统的核心，为全球决策者和公众提供及时、准确和可操作的洞见。

你也许还想看：

http://mp.weixin.qq.com/s?__biz=MzAwMTA3MzM4Nw==&mid=2649500410&idx=1&sn=2121ea5c0ba67ad423d193df65de1f90

微软亚洲研究院

微软亚洲研究院，专注科研26年，盛产黑科技

最新文章

Rust自动形式化证明、LLMs图模式理解、机械臂动作模仿

科学匠人 | 对话松下康之：以具身智能突破人工智能与物理世界的边界

对话《Nature》论文作者，揭秘AI2BMD背后的故事

近实时的全球碳预算，揭示2023年陆地碳汇能力锐减

AI2BMD登上Nature，以量子级精度推进蛋白质动力学

MarS：生成式基座模型时代的通用金融市场模拟引擎

明天直播 | ECCV 2024精选论文分享

如何泛化AI的深度推理能力？

简单而强大：DIFF Transformer降噪式学习，开启模型架构新思路

科学匠人 | 刘海广：发挥“生物多样性”法则的力量，寻找科学的新答案

VIS 2024最佳论文 | VisEval：推动自然语言生成可视化的全新评估框架

从预测风暴到设计分子：人工智能基础模型如何加速科学发现

ECCV上新 | 精选计算机视觉领域6篇前沿论文

Data Formulator：使用prompt就能轻松完成数据可视化

为什么你的LLMs玩不转外部知识？RAG分类学助你诊断！

守护记忆：多模态大模型为认知障碍患者带来全新的训练方法

科研上新 | 金融模型、LLMs结构化剪枝、多模态对齐、AI芯片深度学习编译器

开源工具RD-Agent：让研究与开发过程更智能

VALL-E 2，大幅提升语音大模型的稳健性与自然度

微软亚洲研究院2025校园招聘正式开启！

跨越模态边界，探索原生多模态大语言模型

明天直播 | ACL 2024精选5篇论文直播分享

代码摘要、生成、翻译、修复全覆盖... WaveCoder开启代码智能新篇章

集成大语言模型与产业数据智能，迈向“产业基础模型”

Microsoft Research Forum第四期来了！一起来看多模态模型的最新技术进展与应用

星跃计划 | 微软亚洲研究院北京+温哥华联合科研项目上新，聚焦大语言模型！

开启因果发现新范式！解密复杂系统的核心机制

微软亚洲研究院多项创新技术，弥合大模型低比特量化与终端部署间鸿沟

顶尖高校优秀学子齐聚微软亚洲研究院新星科技节，论道科研！

如何理解和探索大模型的多语言能力？

执业医师转型人工智能研究员，王子龙说“跨”才是关键

ACL上新 | 6篇精选论文带你看最新LLMs进展

周二直播 | AI for Science最新论文分享

USENIX ATC 2024最佳论文 | 微软如何提升云AI基础设施的可靠性

图像解码器；多头混合专家网络；视觉模型美学对齐；医学视觉任务适应基准

大语言模型应用如何实现端到端优化？

LSR-MP：突破分子模拟瓶颈，探索知识引导的AI范式

明天直播 | ICML 2024精选论文分享

nnScaler：重塑深度学习并行策略，大幅提升训练效率

ICML 2024 | 微软亚洲研究院邀你共聚机器学习领域盛会

完全激活稀疏大模型，Q-Sparse突破LLM推理效能

数据驱动模型提升电动汽车电池退化预测准确率

ProbTS：时间序列预测的统一评测框架

你应该知道的10个AI术语

实习 | 微软亚洲研究院“明日之星”开放岗位

脑启发设计：人工智能的进化之路

以智能化为舵手，引领现代计算机系统架构新航向

构建负责任且大规模的生成式人工智能的七个启示

AI赋能天气：微软研究院发布首个大规模大气基础模型Aurora

CVPR上新 | 从新视角合成、视频编解码器、人体姿态估计，到文本布局分析，微软亚洲研究院精选论文

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉