Water Resources | 使用可解释的Transformer神经网络预测天气预报的多样化环境时间序列

科技 2024-11-05 00:02 贵州

使用可解释的Transformer神经网络预测天气预报的多样化环境时间序列

1 研究背景

社区、经济和自然生态系统极易受到极端天气和气候相关灾害的影响。气候变化的增加和平均气候的变暖导致了更频繁和严重的事件。近年来，跨地区和生态系统对可靠的环境预报系统来指导灾害规划和自然资源管理的需求大大扩大。

机器学习方法与对开放访问的高质量环境数据库（即高分辨率原位和遥感观测数据以及基于过程的存档模拟）的广泛访问相结合，允许以出色的计算效率和通常出色的性能对高度复杂的系统和现象进行建模。

Transformer 神经网络的性能优于递归神经网络（RNN），现在是自然语言处理（NLP）建模的当前最先进技术，自然语言处理（NLP）建模是人工智能（AI）的一个子领域，由于其相似的顺序性质，许多 TSF 框架已经从该子领域进行了改编。TNN 在图像分类等任务中也优于卷积神经网络（CNN），在空间和时间领域以及视频处理模型时空方面都显示出尖端的建模能力，甚至用于解决强化学习问题。因此，TNN 被认为是深度学习模型中第一个统一的架构，这最终为时空建模的研究和新发展提供了机会，这是 CNN 和 RNN 自己无法做到的。TNN 查找和建模时空模式的能力可能是 TNN 当前最吸引人的优点，以及它们在生成式 AI（例如 ChatGPT）中日益增长的应用。

2 主要内容

本研究探讨了 TNN 在两个生态重要区域（和平河流域（佛罗里达州）和墨西哥湾北部（路易斯安那州））跨多个环境变量（溪流、阶段、水温和盐度）执行 TSF 的潜力。使用过去的观测和空间分布的天气预报，对 TNN 进行了测试，并量化了从 1 到 14 天提前预报的每个响应变量的预测不确定性。对经过训练的 TNN 的注意力权重进行敏感性分析（SA），以确定每个输入变量对预测窗口中每个响应变量的相对影响。总体模型性能从好到非常好（所有变量和预测范围的 NSE 为 0.78 < < 0.99）。通过 SA，我们发现 TNN 能够学习数据背后的物理模式，根据每个预报调整输入变量的使用，并随着预测窗口的增加越来越多地使用天气预报信息。TNN 出色的性能和灵活性，以及突出模型预测决策过程背后的逻辑的直观可解释性，为该架构对其他 TSF 变量和位置的适用性提供了证据。

3 数据来源与研究方法

1 数据来源

本研究中的 TNN 是使用来自美国东南部两个不同地区的数据集开发和测试的。数据集 1 包括佛罗里达州和平河流域的观测和建模径流、阶段和气候数据，包括 24 个测量特征（溪流和标高）、13 个遥感特征（土壤湿度）和 175 个模拟特征（降雨量、比湿度、气温、风速的水平和垂直分量以及太阳辐射），涵盖 2004 年 1 月 1 日至 2020 年 12 月 31 日的时间段。数据集 2 包括 63 个测量特征（溪流和溢洪道排放、溪流和潮汐计高度以及目标盐度和温度）和 530 个模拟特征（降雨量、地表压力、气温以及风速的水平和垂直分量），位于密西西比河流域下游、庞恰特雷恩湖、墨西哥湾北部以及流入它的各州的相邻河流（即路易斯安那州、密西西比州和阿拉巴马州）以及 2010 年 1 月 7 日至 2020 年 12 月 31 日期间 Bonnet Carre 溢洪道开口的排放量。

2 研究方法

（1）Transformer架构

这项工作中使用的通用 TNN 架构遵循 Vaswani 等人提出的原始序列到序列编码器-解码器框架。TNN 是由 L Transformer 块相互堆叠而成的多层架构。在每个 Transformer 模块中，编码器模块读取并处理输入序列 X 并输出其数字表示，而 decoder 模块读取编码器输出并执行响应变量的预测。

（2）多头注意力机制

注意力机制是 TNN 的支柱。它的功能是以单一序列（自我注意）或不同序列之间（交叉注意力）生成步骤内相互依赖关系的表示。因此，它仍然关注最相关的N_e时间步长，并使用该表示形式预测响应提前 M 个时间步长。注意力机制 A 主要由三个矩阵的后续乘法组成，即查询（Q）、键（K）和值（V）：

其中每个 Q = XW_q，K = XW_k和 V = XW_v将输入序列 X 乘以相应的权重矩阵（W_q、 W_k、 W_v).这些权重矩阵包含将在训练期间校准的参数，其中对预测响应变量所需的序列中包含的最相关信息进行编码。α 是一个比例因子。softmax 运算是一个归一化指数函数，它将实数向量转换为输出概率分布。

(3) 数据预处理：对输入数据集进行缺失值插补、滚动窗口划分、标准化等预处理操作，并通过随机搜索优化超参数。

(4)模型实现和敏感性分析：使用 TNN 对四个环境响应变量进行预测，包括和平河流域的流量和水位，以及墨西哥湾北部的水温及盐度，采用 k - fold 交叉验证评估模型性能，通过敏感性分析评估模型输出对输入因素的敏感性。

4 重要图表

5 研究结论

研究结果表明，TNN模型在所有变量和预测范围内的性能从好到非常好（所有变量和预测范围的NSE值在0.78到0.99之间）。通过SA，研究发现TNN能够学习数据背后的物理模式，根据每个预测调整输入变量的使用，并随着预测窗口的增加越来越多地使用天气预报信息。TNN的优异性能和灵活性，以及突出模型预测决策过程逻辑的直观可解释性，为这种架构在其他TSF变量和地点的应用提供了证据。

尽管TNN在环境预测中显示出巨大潜力，但研究也指出了一些限制。首先，TNNs需要大量的数据进行训练，这在数据稀缺的场景中可能是一个挑战。其次，研究中使用的是再分析的天气预报数据，未来的研究应关注使用实际未修改的预报数据进行训练和测试。此外，对于像河口盐度这样的复杂环境变量，较短的数据可用性可能导致模型性能降低。研究还讨论了模型在极端事件预测中的局限性，特别是在训练数据中未包含的极端事件。

6 小编说

该文章题目为“Interpretable Transformer Neural Network Prediction of Diverse Environmental Time Series Using Weather Forecasts”，于2024年发表在《Water Resources Research》，IF=4.6。

引用：López OE ,KaplanD ,LinhossA .Interpretable Transformer Neural Network Prediction of Diverse Environmental Time Series Using Weather Forecasts[J].Water Resources Research,2024,60(10):e2023WR036337-e2023WR036337.

http://mp.weixin.qq.com/s?__biz=MzkxMDI2NjMxNQ==&mid=2247556676&idx=5&sn=a5afefdc77a36a81cfe57063210073ce

生态遥感前沿

分享生态遥感领域实用教程、最新科研成果及资讯，交流、合作等事宜请加Novel_2020

最新文章

方向好！本科生一作TGRS！

方精云院士团队系统评估中国及各省区碳排放、清洁能源减排及生态系统碳汇，为我国“双碳”行动提供科学支撑

Journal of Hydrology好文！受气候变化影响，中国未来陆地受复合干旱和热浪影响的可能性大幅增加

徐湘博、张林秀与合作者在Nature Food发表最新研究文章！

国家生态科学数据中心在一区TOP期刊RCR发表最新研究

傅伯杰院士团队最新全球性研究！

宇宙五大刊不仅没预警，还升到一区了

Nature Communications 好文！植被对土壤水分的敏感性普遍增加

成果速递丨硕士毕业生李万隆以第一作者在《地理学报》发文：京津冀和长三角城市群建设用地分配研究

Science正刊！草地的历史与挑战

读博士，去哪找那么多创新点？水水得了...

重磅！2024地学“高被引科学家”名单公布！

环境与生态领域2024年度“全球高被引科学家”

地理所7年的评估工作，发表在Nature子刊！

青藏高原所《Nature Plants》最新研究成果！

震惊学术界！继Science后再发Nature！深度学习助力遥感领域顶刊思路“大爆发”！

西北师范大学潘竟虎教授团队在Catena发表最新研究！

中国农科院农业环境与可持续发展研究所在黄河流域玉米水分利用效率阈值及关键驱动因子研究中取得新进展

《Agricultural and Forest Meteorology》一种基于端到端的卫星GPP估算模型

Nat Commun | 可持续土地管理增强气候变化下生态与经济的多功能性

张宁博士最新Nature正刊！

北大李双成教授团队博士生一作GCB！

Earth's Future好文！北京大学彭建教授团队发文，揭示大湖流域脱钩的社会生态网络

《Habitat International》最新发文，新型城镇化通过调控生态系统供需结构能够促进SDGs目标实现

牛书丽课题组在Nature Communications发表最新研究文章！

院士团队硕士生共一发Nature正刊！

南信大学博士生一作在Science子刊发表最新研究成果！

河海大学周钦博士在Resources, Environment and Sustainability上发表最新研究成果！

Nature Climate Change | 北方野火气溶胶排放加剧北极变暖

Nature Geoscience | 中国因清洁空气行动计划而恢复生态系统生产力

重磅！Nature即将推出两本新刊！

EIA Review好文！是什么主导了不同城市扩张模式下生态系统服务的变化？——来自中国长江三角洲地区的证据

Nature Communications！全球绿地为城市降温提供了显著但不平等的贡献

AFM好文！2022 年中国破纪录的复合热浪和干旱事件对植被生长的影响

王劲峰研究员最新研究，5000余次阅读！

欢迎相聚三亚，共探生态遥感新前沿

中科院生态环境中心最新PNAS！

突发！科睿唯安官宣：将取消eLife影响因子！

思路独特！硕士生一作发Nature子刊！

东北林业大学周正虎教授团队一年连发3篇Nature Communications！

Nature经典文章！城市热岛的规模主要由气候和人口解释

四川大学陈磊教授等在地球科学顶刊《Earths Future》发文：变绿引起的生物物理效应导致温带和北方森林的春季和秋季物候提前

样本108，nature照样发！

中山大学博士毕业生罗浩Nature Communications一作兼通讯！

Journal of Hydrology好文！二十四节气映照下的中国降水格局与时空变迁

Communications earth & environment | 物候对气候变化的响应依赖于春季增温速率

最强总结！十大回归类算法模型！！

最新世界一流学科排名（地理学/地球科学/遥感技术/生态学/大气科学等）

周成虎院士、王江浩研究员等在Science子刊发表最新研究成果

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉