人工智能大模型为精准天气预报带来新突破

学术科学 2024-12-25 14:46 北京

天气预报不仅是国际科学前沿领域, 也具有巨大的经济与社会价值. 目前的数值天气预报(numerical weather prediction, NWP)范式可以追溯到20世纪50年代, 通过求解描述大气运动的偏微分方程来推断未来大气状态, 且针对未来几天的预报往往需要花费超级计算机的数百个核时. 欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts, ECMWF)的综合预报系统(Integrated Forecasting System, IFS)技巧在众多国家或机构的业务预报模式中脱颖而出, 引领了NWP发展的风向标. 世界气象组织将数值天气预报革命评价为20世纪最重要的科学、技术和社会进步之一.

然而, 使用传统方法进一步提升天气预报水平遇到了瓶颈, 而人工智能(artificial intelligence, AI)技术的不断涌现为解决这些瓶颈提供了新思路^[1]. 近年来, 伴随高质量气象资料的不断累积, AI技术, 特别是深度学习方法, 逐渐被用于建模多种多样的地球系统过程, 几乎覆盖了所有时空尺度的天气/气候事件. 同时, AI技术与传统资料同化、集合预报等方法的交叉融合也不断加深. 与传统方法相比, 数据驱动的AI气象模型直接从海量数据中学习潜在物理规律, 而不依赖偏微分方程. 其中, 2023年华为提出的盘古天气AI模型是最具代表性的范例之一^[2]. 目前, 大量的回报评估表明, 其准确性可与IFS相媲美, 并且计算成本要小得多, 相关研究论文于2023年7月20日发表在Nature. 这种数据驱动建模范式的成功使得AI气象模型成为“2023年中国十大科学进展”中最引人注目的突破之一.

具体来说, 盘古天气定制了3D Earth-specific Transformer架构, 并使用了分辨率为0.25°的40年ERA5再分析资料训练模型, 可以提供包括地势高度、风、压力、温度和湿度等变量的全球三维预报结果. 值得注意的是, 盘古天气较IFS的预报时效约有0.6 d的提升, 且针对台风路径的回报准确性也提高了约25%. 此外, 它可以在几秒钟内生成几天的全球天气预报, 能耗较传统方法降低了10000多倍. 盘古天气也与Google DeepMind的GraphCast^[3]和Nvidia的FourCastNet^[4]一起被Science评选为2023年世界科学十大进展之一, 标志着AI与大数据在天气预报领域取得重大突破.

国内外进展

AI气象模型蕴含高度非线性的神经网络结构, 直接从海量数据学习并表征物理过程. 通过数据驱动的方式, 在不依赖明确物理方程的情况下达到甚至超越传统天气预报方法, 引起了“AI+气象”交叉领域的广泛关注, 并掀起了“AI+气象”的建模浪潮.

除了盘古天气之外, 我国涌现出一系列独立发展的AI大气和海洋模型, 如伏羲^[5]、风乌^[6]、天行^[7]、NowCastNet^[8]、AI-GOMS^[9]和羲和^[10]等. 包括复旦大学、同济大学、清华大学、国防科技大学、上海人工智能实验室和国家气象中心在内的许多研究机构也在不断增强这些AI气象模型的预报能力, 例如提升时空分辨率和提供集合预报等. 其中一些模型在一定程度上嵌入了现有的物理规律, 具有较好的物理可解释性, 并且比传统的数值模式具有更高的预报技巧.

国外的许多研究机构也在积极推进AI气象模型的发展, 除了上述GraphCast和FourCastNet外, Google DeepMind的GenCast^[11]、Google的MetNet^[12,13]系列和NeuralGCM^[14]、微软的ClimaX^[15]、ECMWF的AIFS均能以纯数据驱动的推理方式超越数值预报技巧.

目前, 包括中国气象局和ECWMF在内的多个全球气象服务机构已经开始实时评估多个AI气象模型的预报性能, 例如盘古天气、伏羲、GraphCast、FourCastNet等, 并致力于将这些模型真正投入业务预报. 这些迹象充分显示出“AI+气象”前沿研究的强大影响力, 有望以更低的成本为公众提供更高准确率的预报结果. 现有评估结果表明, AI气象大模型具有巨大的潜力, 未来发展值得期待.

创新性与科学意义

数据驱动建模范式在提高预报精度和加速推理程等方面展现出明显优势和巨大发展潜力, 并引发起热烈讨论与探索. 例如, AI气象模型是否是大气演变偏微分方程更有效的求解方案? 其预报技巧提升是否源自从海量数据中学到了可靠的物理机制? 如何通过明确的数理方法表征其捕捉到的物理机制? 诸如此类的问题均由于数据驱动建模范式的可解释性不高; 且能够有效回答此类由AI气象大模型衍生出的科学问题和挑战, 可能比AI气象模型本身的价值更大^[16].

尽管缺乏明确的可解释性是AI气象模型面临的严峻问题, 但其高技巧和低能耗有望最终服务并受益于公众. 现阶段的AI气象模型可辅助甚至补充传统数值天气预报模型的天气预报信息, 特别是对于传统数值模型难以准确模拟的高影响天气和气候事件.

未来探索空间

AI技术正在引领天气预报领域的技术变革. 除了进一步开展“AI+气象”的交叉研究外, 也应注重补强基础研究, 并将AI方法的优势扩展至气象研究的其他领域. 以下是开展进一步探索的几个方面.

(1) 端到端的预报形式. 当前的AI气象模型大多使用ERA5再分析资料训练, 可能不适用于业务系统的初始场, 预报技巧得不到保障. 且大多只支持从固定时刻开始起报, 时效性较差. 可以充分发挥AI模型计算速度快、自带优化模块的优点, 发展基于AI模型的资料同化系统, 发展使用卫星等多源观测资料进行训练的AI气象模型, 可实时获取更新数据并借助AI高效的推理能力提供快速预报, 这对于极端天气的预报和防灾减灾非常有益.

(2) 物理-数据融合驱动的建模. AI气象模型在长时序的预报中可能输出不符合基本物理约束的结果. 可以利用偏微分方程描述明确的动力过程, 在数据驱动的基础上引入物理约束, 使用AI方法建模未知过程, 例如NeuralGCM.这样的融合建模不仅可以增强AI模型的可解释性, 还有助于提高预报能力.

(3) 耗时过程的AI加速与替代. AI模型的高效性有利于气象领域计算密集型任务的加速, 如集合预报、数据同化和目标观测等; 也可以用来加速数值模式的关键过程, 如参数化方案、辐射传输等. 进一步探索AI方法在改进资料同化、集合预报的计算精度和效率等方面的应用, 有望将获得结果的时间从数小时大大缩短到几分钟.

(4) 引入多圈层变量和过程. 将多圈层(大气圈、水圈、冰冻圈、生物圈、岩石圈)物理要素融入AI模型以开发耦合的AI地球系统模式. 目前, 大多数AI模型只建模单个圈层变量(例如仅大气或海洋), 导致预报时效较短. 然而, 对于较长时间尺度的天气和气候事件, 特别是在次季节到季节尺度, 引入与陆地等其他过程相关的变量是至关重要的. 多圈层的AI模型有望解决当前次季节到季节的预报难题.

(5) 增强泛化能力. AI气象模型的迁移外推成本较低, 然而其训练过程对计算资源的需要庞大. 在计算成本方面, AI气象模型的训练过程与传统数值模式相比并无明显优势. 要提高AI气象模型的应用价值, 需重点关注增强其泛化能力. 此外, 当前AI气象模型面临的过平滑等问题, 使得AI气象模型在预报极端天气事件等方面不尽如意. 根据普遍近似原理^[17], 神经网络可精确逼近各种非线性连续算子和泛函. 因此, 研究更具泛化能力的算子学习、生成式模型等方法, 构建面向气象领域的高效AI算法^[18,19],有望提升AI气象模型的泛化性, 进一步拓展AI气象模型的应用空间, 增强对极端事件等的预测技巧.

(6) 基于AI气象模型的可预报性探索. 具有更高模拟和预报能力的AI气象模型必然从海量数据中捕获了可靠的物理机制. 基于这类更高技巧的模型开展天气和气候事件的可预报性研究, 并明确其表征的物理过程, 可进一步提升对地球系统非线性过程的认知和预报技巧, 尤其是对数值模式难以模拟的现象.

(7) 探索AI气象预报与其他新型信息技术融合的新范式. 新兴信息技术如云计算、分布式数据库和数据挖掘等的迅猛发展为AI气象模型的进一步拓展应用提供了更多潜力. 有效融合各种信息技术, 是提升AI气象模型的实际应用水平以及推广其应用的核心. 进一步地, 将AI气象模型与大数据、量子计算、数字孪生等前沿技术相结合, 开拓更广泛的应用领域, 是探索推动AI气象模型应用潜力的有益方向.

结语

先进的AI技术可以进一步推动地球科学领域发展, 在一定程度上引起研究范式的转变, 不应简单地将其视为数值模型的替代品. 当前, 数值预报仍遵循传统的发展途径,从物理原理和基本公式出发, 研究天气气候的变化机制, 并依托数据搜集、加工处理来生成预报结果. 然而, 人工智能驱动的科学研究(AI for science, AI4S)范式的出现^[20]为数值预报方法开辟了新的路径. 人工智能算法能够通过海量数据的训练, 透过反向分析输入和输出数据间的因果关系, 揭示数据所包含的规律, 以精确描绘数据背后隐藏的天气气候变化机制.

融合AI气象模型与数值模式的优点, 采用AI气象模型对数值模式的参数化方案等耗时过程进行加速与替代, 在训练AI气象模型的过程中采用数值模式进行物理约束等, 提高预报的可解释性, 都是可以探索的优势互补方法, 从而进一步提高预报技巧.

未来, 应采取更加开放的态度将动力驱动方法和数据驱动方法的优势有机结合起来. 然而, 如何确保AI模型的可解释性和可信度, 并进一步扩大应用场景以充分发挥其优势, 还需进行更深入的探究.

【参考文献】

[1] 黄建平, 陈斌, 人工智能技术在未来改进天气预报中的作用, 科学通报, 2024, 69: 2336-2343

[2] Bi K, Xie L, Zhang H, et al. Accurate medium-range global weather forecasting with 3D neural networks. Nature, 2023, 619: 533-538.

[3] Lam R, Sanchez-Gonzalez A, Willson M, et al. Learning skillful medium-range global weather forecasting. Science, 2023, 382: 1416-1421.

[4] Kurth T, Subramanian S, Harrington P, et al. Fourcastnet: Accelerating global high-resolution weather forecasting using adaptive fourier neural operators. In:Proceedings of the platform for advanced scientific computing conference, 2023. 1-11.

[5] Chen L, Zhong X, Zhang F, et al. FuXi: a cascade machine learning forecasting system for 15-day global weather forecast. npj Climate and Atmospheric Science, 2023, 6: 190.

[6] Chen K, Han T, Gong J, et al. FengWu: Pushing the Skillful Global Medium-range Weather Forecast beyond 10 Days Lead. arXiv: 2304.02948, 2023.

[7] Mu B, Wang G, Yuan S, et al. TianXing: A Linear Complexity Transformer Model with Explicit Attention Decay for Global Weather Forecasting, Adv Atmos Sci, 2024, doi: 10.1007/s00376-024-3313-9

[8] Zhang Y, Long M, Chen K, et al. Skilful nowcasting of extreme precipitation with NowcastNet. Nature, 2023, 619: 526-532.

[9] Xiong W, Xiang Y, Wu H, et al. AI-GOMS: Large AI-Driven Global Ocean Modeling System. arXiv: 2308.03152, 2023

[10] Wang X, Wang R, Hu N, et al. XiHe: A Data-Driven Model for Global Ocean Eddy-Resolving Forecasting. arXiv: 2402.02995, 2024.

[11] Price I, Sanchez-Gonzalez A, Alet F, et al. Gencast: Diffusion-based ensemble forecasting for medium-range weather. arXiv: 2312.15796, 2023.

[12] Sønderby C K, Espeholt L, Heek J, et al. Metnet: A neural weather model for precipitation forecasting. arXiv: 2003.12140, 2020.

[13] Espeholt L, Agrawal S, Sønderby C, et al. Deep learning for twelve hour precipitation forecasts[J]. Nature communications, 2022, 13: 1-10.

[14] Kochkov D, Yuval J, Langmore I, et al. Neural general circulation models for weather and climate. Nature, 2024, 632: 1060–1066

[15] Nguyen T, Brandstetter J, Kapoor A, et al. Climax: A foundation model for weather and climate. arXiv: 2301.10343, 2023.

[16] Ebert-Uphoff I, Hilburn K. The outlook for AI weather prediction. Nature, 2023, 619: 473-474.

[17] Otto S E, Rowley C W. Koopman operators for estimation and control of dynamical systems. Annual Review of Control, Robotics, and Autonomous Systems, 2021, 4: 59-87.

[18] Mezić I. Analysis of fluid flows via spectral properties of the Koopman operator. Annual review of fluid mechanics, 2013, 45: 357-378.

[19] Li Z, Kovachki N, Azizzadenesheli K, et al. Fourier neural operator for parametric partial differential equations. arXiv:2 010.08895, 2020.

[20] 王飞跃, 丁文文. 分布式自主科学：科学多样可持续性发展的新范式. 中国科学院院刊, 2023, 38: 1501-1509

作者简介

黄小猛

清华大学地球系统科学系长聘教授, 国家超级计算无锡中心总工, 地球系统数值模拟教育部重点实验室主任, 世界天气研究计划中国委员会“大数据和人工智能”工作组组长. 长期从事地球系统高性能计算、大数据和人工智能方面的研究工作, 多项成果被地球系统数值模拟科学大装置和美国大气科学研究中心的CESM模式采用.

了解详情，请阅读全文

[点击下方链接或阅读原文]▼

张峰, 黄小猛, 穆穆, 秦博, 李佳皓. 人工智能大模型为精准天气预报带来新突破. 科学通报, 2024, 69(34): 5016-5019

https://doi.org/10.1360/TB-2024-0543

中国科学杂志社

《中国科学》杂志社是国内外较具有影响力的科技期刊出版机构，目前主要产品包括《中国科学》系列、《科学通报》、《国家科学评论》、《国家科学进展》、《能源化学》和《医学+》等22种科技期刊，旨在见证中国科学发展，促进国际学术交流。

最新文章

EB病毒发现60周年，甲子展望新篇章

金属超分子化合物对映选择性靶向和稳定猴痘病毒的mRNA G-四链体并通过增强免疫反应抑制猴痘病毒复制 | NSR

具有颜色分辨能力的超低功耗MoS2光电突触器件

人工智能大模型为精准天气预报带来新突破

碳-14可通过食物链转移到鱼体内影响鱼脑中生物分子代谢 | NSR

南京邮电大学李兴鳌教授团队 | 室温下单壁碳纳米管插入、硼取代和锂掺杂提高COF-108的储氢性能

二维超晶格中，居里温度以上超快自旋流的产生及其太赫兹辐射 | 北航/物理所/复旦联合团队NSR论文

张锋/杨晓玉/谭跃球/汪凌波等团队合作发现MYCBPAP基因有害变异导致弱畸精子症

解锁Pt的新潜力：通过分子修饰铂表面实现二氧化碳向有价值的化学资源的转化│NSR论文

姜培学院士：面向“双碳”目标的能源转化利用领域前沿交叉战略研究

迈向健康未来：华中农业大学探索“治未病”新理念

山东科技大学张焕水团队 | 基于最优控制的优化方法

新一代离子交换膜：限域离子膜 | NSR

上交大闵雄阔, 翟广涛等 | 视频感知质量评价综述

Science Bulletin | 闵军霞/王福俤团队在靶向铁死亡防治脂肪肝领域再获突破

可集成的自旋波量子存储器 | NSR

北京量子研究院龙桂鲁课题组 | 基于格密码的量子通信网络接入认证方案

Science Bulletin | 人工光合作用的突破：使用Zn-GaN催化剂实现高效CO₂和H₂O转化

可用于治疗大体积肌肉缺失的多功能人工肌肉∣NSR

【S&S热点文章】邬江兴院士团队：论一体化安全人才及负责任开发者培养

物理学与人工智能的连接：2024年诺贝尔物理学奖解析

告别复杂体系的实验试错法：离子热电中的机器学习 | NSR

陈杰院士团队 | 联盟形成问题：以能力为中心的分析和通用模型

冰天体生命如何探测？

湿度不敏感、强韧离子凝胶及其在膝关节压力监测上的应用 | NSR

Medicine Plus | 杜斌/翁利/陈宏达团队合作研究揭示中国住院非儿童癌症患者脓毒血症负担及趋势

【Science Bulletin编辑精选】极端粒子、极端恒星、极端爆炸

CaAs3 体系接近Mott-Ioffe-Regel极限的量子振荡研究 | NSR

大模型芯片与系统专题出版 | 特邀编辑：尹首一、唐漾、涂锋斌

揭秘生态系统对大气汞沉降变化的响应 | NSR

南航姜斌团队 | 基于联盟形成博弈的异构无人机集群任务分配算法

《科学通报》& Science Bulletin大讲堂第六讲——西湖论坛在杭州举办

单神经元深度学习“小模型”及其时间序列预测应用 | NSR

Science Bulletin | 抗菌剂三氯卡班通过影响内皮细胞代谢促进心脏类器官发生心肌肥大

SCLS专题 | 基因组编辑技术及其在医学领域的应用（特邀编辑：李大力，周斌）

气候变化导致愈发频繁的中国复合低风-低光极端事件 | NSR论文

氢化物超导体A15-La4H23中发现反常金属态

Science Bulletin | 陆军军医大学张志辉/李旻典等：营养生物钟——进餐时间的调整抗疲劳吗？

方小敏院士 | 中亚黄土粉尘与冰冻圈演化、太平洋生产力和全球变化的联系

Medicine Plus | 儿童青少年神经介导性晕厥诊治最新指南解读

【Science Bulletin编辑精选】超导材料及原理研究进展

NSR综述：多模态大语言模型

扬子地块碎屑矿物揭示华南三次挤压造山事件 | NSR论文

mRNA技术与生物医药应用专辑 |《科学通报》

用于伤口监测的还原氧化石墨烯导电功能医用蚕丝缝合线

核磁信号的扩音器：MOL用于仲氢超极化技术 | NSR

【Science Bulletin编辑精选】二维磁性材料与拓扑自旋物态

可见高透明、红外宽波段调制的热致变色智能窗 | NSR

Science Bulletin | 钻探揭示亚洲中部沙漠形成演化的空间异质性

光模块控温微器件用高强高效热电材料 | NSR

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉