宁波东方理工大学团队:利用可解释性人工智能探索地形与降水关系以推进未来气候预测

学术   2025-01-15 18:30   四川  

宁波东方理工大学(暂名)的张东晓讲席教授与陈云天助理教授团队以及中国气象科学院的李建研究员团队合作,在Cell Press细胞出版社交叉学科期刊Nexus发表题为“Uncovering Terrain-Precipitation Equation with Interpretable AI: Towards Future Climate Projection”的文章。论文针对气象领域中的地形-降水关系问题,提出了一种基于可解释人工智能的知识发现框架,并构建了知识生成与利用的迭代优化过程。研究从亚洲地形-降水数据中发现了新的显式方程来描述降水模式与地形特征之间的复杂关系,并基于此进行未来降水的高分辨率预测。该研究提供了在不同未来气候情景下地形降水模式变化的相关见解,有助于更好地应对气象科学挑战。

研究背景

降水对于表征气候系统至关重要,因其具有多变性,对全球气候变化、水资源可用性、生态系统以及人类社会产生了深远影响。此外,洪水和泥石流等灾害通常发生在复杂地形区域,这要求我们更深入地理解地形与降水之间的关系,以减轻其影响。


尽管卷积长短期记忆网络和生成模型等人工智能驱动的模型在现代降水预测中取得了显著进展,但这些“黑箱”模型本身无法加深对自然现象及其底层机制的理解。实际上,真正能增进对底层机制理解的是通过显式方程建立物理关系,这是从观测现象到现实理论的关键一步。例如,历史上人类凭借经验和统计原理就能通过打雷预测即将到来的雨水,但对雷电与降水之间基本关系的理解则是在历史上很晚才通过物理方程的建立而实现的。鉴于降水的形成涉及气候系统内多种元素的复杂相互作用,揭示描述降水与地形之间关系的显式方程仍是目前面临的紧迫挑战。


目前,现有的地形-降水方程往往是通过基于地理回归模型建立的。虽然这些模型有助于理解地形对降水影响的规律和机制,但它们往往依赖于研究者提出的物理解释项,且采用过于简化的线性形式,准确性有限。鉴于地形与降水之间的关系十分复杂,从庞大的潜在变量组合中手动选择最优公式是不现实的。针对这一挑战,研究团队基于可解释人工智能从数据中直接挖掘出潜藏的物理方程,避免了人为设定物理解释项。该方程在应用于降水数据时表现出极高的准确性,优于传统的经验模型,且能够适应不断变化的气候模式。


图1. 理解地形降水关系的两种方法:人类推导与人工智能模型


核心内容

1. 遗传算法-地理加权回归


研究团队提出了一种基于人工智能的知识发现框架,称为遗传算法-地理加权回归(GA-GWR),旨在依据地球科学的领域知识,揭示地形与降水之间的潜在关系。GA-GWR方法将遗传算法与地理加权回归有机地结合在一起。传统的地理加权回归方法通常需要预先确定回归模型中的相关项,这高度依赖于经验,限制了模型的使用范围和效果。通过遗传算法中的交叉和变异形成新的项,GA-GWR能够高效地探索大量可能的公式,从而识别出研究区域最合适的方程项的组合。这种动态的特征选择过程能够显著提高模型的准确性和效率。如图2所示,GA-GWR包含几个关键步骤,包括数字化编码、交叉、变异、适应度计算以及进化。其中,适应度函数通过地理加权回归计算,充分考虑了气象问题中的空间异质性。


图2. 由所提出的 WS-PINNs 模型预测的 1 号动脉瘤中的 3D 速度场


2. 平均年降水量与地形关系方程挖掘


本研究采用了四个基本地形参数,即海拔、起伏度、坡度和坡向,进行高精度的地形参数化。年度降水数据来源于APHRODITE数据集。在此背景下,研究采用了所提出的遗传算法-地理加权回归以从1951年至2015年(共65年)的平均降水量数据中揭示潜在方程。最终挖掘出的方程为:



其中,P、H、R、α和β分别代表平均年降水量、海拔、起伏度、坡度和坡向;Hx和Hy分别是经度和纬度方向上网格间的海拔梯度。系数ω和b均是从GWR中获得的空间场。如图3所示,新发现的公式与观测数据拟合良好。拟合值的决定系数(R²)为0.991,大多数网格的相对误差低于5%。与之前提出的经验公式和基线模型相比,该公式在中尺度地形内拟合降水数据时表现出更高的精度,且使用的方程项数更少。方程的每一项具有明确的物理意义,揭示了地形影响降水的潜在机制。例如,常数项b的分布与不同气候区观察到的降水模式相一致,有效地捕捉了与地形特征无关的降水分量。海拔(H)和起伏度(R)在塑造复杂地形上的降水模式中起着主导作用。以喜马拉雅山脉为例,可以观察到其南坡和北坡之间显著的降水模式差异,反映了雨影效应。起伏度在一定程度上作为补偿因素,抵消了海拔对降水的影响。方程最后两个梯度项主要代表地形起伏度和较大尺度上的坡度变化对降水的影响。由于亚洲季风系统主要从海洋携带水汽,这些项代表了中尺度地形拦截水汽的分量,进而影响降水模式。


图 3. 挖掘出的方程与数据的拟合程度以及系数场


3. 气候变化对地形-降水关系的影响


研究团队进一步对年降水量进行了地形与降水关系的时空变化方程挖掘,结果为:



在独立优化的情况下,该方程的结构与方程(1)一致,仅仅系数变为时空场。这进一步验证了该方程结构在描述地形与降水之间复杂关系的能力和稳定性。通过对该方程的时变系数场进行分析,揭示了气候变化对地形-降水关系的影响。研究作者发现了一个名为“1995年转折点”的现象,即在1995年前后,不同地形区域的海拔与降水关系发生了明显的变化,如图4所示。这与20世纪90年代以来的其他气候变化现象相一致,如中国变暖的加速、高纬度地区北极涛动(AO)和北大西洋涛动(NAO)指数的变化以及太平洋年代际变率(PDV)空间模式的突然变化。这表明气候变化可能对地形-降水关系产生深远影响


图 4. 气候变化对不同区域的地形-降水关系的影响


4. 基于知识嵌入的气候-地形-降水模型构建


考虑到气候变量与地形-降水关系之间的复杂联系,简单的回归模型不足以捕捉这种复杂性。因此,研究作者采用了一个物理信息神经网络(PINN)来模拟这种关系。该网络以ERA5数据集中的23个气候变量作为输入,以预测方程(2)中的系数ω和b。作者通过一种称为SHapley Additive exPlanations(SHAP)的可解释机器学习技术,解释了每个气候变量对地形-降水关系的影响吗,如图5所示。论文发现与植被相关的气候变量,如植被覆盖度和叶面积指数,在塑造地形-降水关系中起着至关重要的作用,且高植被和低植被对降水模式的影响存在差异。此外,传统的气象指标,如温度、风速、地表压力和云量,也会影响地形-降水关系,但影响模式各不相同。


图5. 气候变量的相关性聚类矩阵以及模型的预测能力和可解释性


5. 未来场景下的长期降水模式预测


最后,研究作者采用所提出的可解释模型进行了未来场景下的长期降水模式预测,通过第六次耦合模式比较计划(CMIP6)的低分辨率未来气候数据,评估了不同气候情景下精细尺度的降水模式变化。研究考虑了SSP126、SSP370和SSP585三种不同的气候情景,分别代表不可持续与可持续的人类发展模式。如图6所示,在高强迫气候情景下,当2m气温(t2m)较高时,中国东南部和印度半岛的降水明显增加。然而,在一些地形特征复杂的地区,降水却有所减少,表明气候变暖对降水的影响受到地形的制约。与温度的影响不同,植被对降水的影响则主要集中在青藏高原和中国西部地区。


图 6. 不同气候情景下的未来降水模式预测

论文总结

本论文提出了一种基于可解释人工智能的知识发现框架,不仅能够从数据中揭示地形-降水方程以提供新的见解,还将发现的知识集成到人工智能模型中,有效提升了模型的可解释性和未来气候预测的准确性。


该交叉学科研究将人工智能手段与地球物理技术有机融合,实现了知识发现与知识嵌入的闭合优化,从而解决实际科学问题,深化对地形-降水关系的理解,为人类可持续发展与降水预测提供了重要的理论基础。

研究团队介绍


论文第一作者为宁波东方理工大学(暂名)的博士后徐浩,东方理工的张东晓教授为本文的通讯作者(Lead Contact),陈云天助理教授和中国气象科学院的李建研究员是本文共同通讯作者。


OnePage

扫码二维码阅读全文或点击“阅读全文”

论文标题:

Exploring Terrain-Precipitation Relationships with Interpretable AI for Advancing Future Climate Projections

DOI

https://doi.org/10.1016/j.ynexs.2024.100045                   NA NA

点击查看其他文章

约州立大学、康奈尔大学团队:人工智能时代下的微塑料分析

香港大学水文地质课题组:机器学习加速的多目标裂缝地热系统设计

香港大学水文地质课题组:机器学习加速的多目标裂缝地热系统设计

点击名片关注Nexus官方公众号

AEii国际应用能源
发布应用能源领域资讯,介绍国际应用能源创新研究院工作,推广应用能源优秀项目,增进应用能源领域合作
 最新文章