学术前沿 | Journal of Hydrology 水文学和水资源学科的深度学习:概念、方法、应用和研究方向

学术   2024-11-21 08:03   陕西  

在过去的几年里,深度学习 (DL) 方法在水文学和水资源应用领域获得了大量认可。从讨论 DL 的基本概念开始,我们讨论了最先进的 DL 架构,例如长短期记忆 (LSTM)、卷积神经网络 (CNN)、生成对抗网络 (GAN) 和编码器解码器模型,这些模型近年来受到广泛关注。还讨论了 DL 模型的最新进展,例如旨在处理连续时间序列数据的注意力模型和 Transformer 神经网络。概述了将基于物理的水文模型与最先进的 DL 模型(称为物理引导深度学习 (PGDL))集成,以及其在提高水文预测的准确性和可解释性方面的潜力。我们强调 PGDL 有可能提高水文预测的物理一致性和稳健性。我们进一步深入研究了可解释的人工智能 (XAI),研究了构建可解释模型的各种技术。目标是使用户能够理解并自信地信任机器学习算法的结果(模型输出)。此外,我们还深入研究了深度学习 (DL) 在水文和水资源领域的各种应用,包括干旱和洪水预测、遥感应用、水质评估、地下水流反转问题、地下水位预测和水文气候变量缩小等领域。
图 1.(A) 说明了人工智能 (AI)、机器学习 (ML) 和深度学习 (DL) 之间的分层关系,其中 AI 代表更广泛的领域,ML 作为其子集,DL 作为机器学习的子集,以及 (B) 详细介绍了 DL 的三个核心组成部分:用于分类和回归任务的监督学习,用于聚类和分类的自监督学习, 以及用于聚类和降维的无监督学习。
图 2.DL 模型中训练过程的示意图。该图演示了通过隐藏层的正向传递、使用 loss 函数计算 loss 以及通过反向传播算法对模型参数进行迭代细化。
图 3.(A) 说明自变量数据和因变量数据之间的欠拟合、过拟合和最优拟合的概念。(B) 将 Dropout 正则化应用于 DNN (B-2),隐藏层 1 和 -2 的 dropout 率分别为 0.5 和 0.25。(C) 通过监控训练期间的验证损失并在一定数量的 epoch 后验证损失增加时停止训练过程来提前停止。
图 4.(A) 批量归一化在深度神经网络 (DNN + BN) 中的一层之后应用。BN 引入了两个额外的可训练参数:scale(γ)和 Shift(β)以及层中每个神经元的权重和偏差。(底板)所有可训练参数在每次迭代中使用优化器(如 Adam 优化器)使用反向传播算法进行更新。(B) K 折交叉验证过程:训练数据被划分为不同的集(折叠),每个子集依次作为验证集,而其余数据用于训练。最终验证分数是所有折叠的验证损失的平均值,为看不见的数据提供更可靠的性能估计。
图 5.用于二进制分类的 CNN 架构的示意图。该架构包括三个关键组件:卷积层、池化层和全连接神经网络 (FCNN)。
图 6.LSTM 模型在时间步 t 的架构由三个门组成:忘记门、输入门和输出门。
 7.示意图描述了自动编码器架构。图 7 (A) 提供了自动编码器的更详细视图,突出显示了编码器、解码器和“瓶颈”组件,有助于从输入中捕获和压缩突出特征,以实现高效的数据重建。图 7 (B) 提供了通过编码器函数将输入 (x) 转换为隐藏表示 (h),然后通过解码器函数重建为输出 (o) 的过程。原始输入和输出之间的差异构成了损失。
图 8.生成对抗网络 (GAN) 模型的示意图。
图 9.该图描述了专为 seq2seq 预测任务设计的编码器-解码器 LSTM 架构。
图 10.Attention 模型架构基于用于 seq2seq 预测问题的编码器-解码器模型。
图 11.用于 seq2seq 时间序列预测问题的基于编码器-解码器的 Transformer 网络的示意图。
图 12.水文学中迁移学习的图示。(a) 该面板演示了迁移学习如何在类似任务中运作。它显示了在干旱预测 (Task-1) 上训练的深度学习模型的权重和偏差作为河流预测 (Task-2) 的初始参数的过程。模型之间的这种信息交换提高了效率并节省了计算资源。(b) 这里描述了同一数据集中不同任务之间的迁移学习。具体来说,来自热浪预测训练的模型 (任务-1) 的早期层特征图被另一个模型重用来对热浪进行分类 (任务-2)。这表明了利用共享信息进行跨任务学习,从而提高了模型性能。

结论

DL 模型有可能处理和发现复杂和高维数据集中的隐藏模式,这对于水文学和水资源学科很有价值。在这篇综述中,我们重点介绍了 DL 概念、方法和应用的最新发展。从这项研究中可以得出以下结论:

  • (一)

    DL 方法在预测水循环中的各种水文通量、水文气候极端事件以及为各种水资源应用提取有意义的信息方面获得了发展势头。最先进的 RNN 架构(如 LSTM、CNN 的变体以及基于这些模型组合的混合模型)可以提供优于传统概念和统计模型的卓越配置。

  • (二)

    DL 方法可以补充传统的基于物理(过程)的模型;例如,物理引导深度学习 (PGDL) 建模框架结合了基于域和处理的知识以及 DL 概念,是适用于各种应用的宝贵工具。结合与水文过程的物理理解相关的领域(专家)知识可以减少模型参数的搜索空间,从而实现更准确的模拟、物理一致的预测和改进泛化.通过结合物理约束,PGDL 提供了物理一致且稳健的解决方案,在许多应用中都优于最先进的 DL 模型。

  • (三)

    理解和追溯 DL 算法是如何得出结果或决定的至关重要。因此,更好地了解 DL 模型的架构而不是毫无疑问地信任它们(即称为“黑匣子”)至关重要。XAI 的概念允许用户理解 DL 算法创建的结果和输出并获得信心。XAI 可以用作科学知识发现工具,而不仅仅是数据拟合工具。XAI 使用显著性图、激活可视化和归因方法等技术,旨在使 DL 模型在处理在不同景观上演变的复杂水文过程时更加透明和可解释。

  • (四)

    注意力模型和 Transformer 网络模型在水文学中的应用目前受到限制。与传统的 RNN/LSTM 和 CNN 模型相比,这些概念在计算效率和准确性方面表现出显著优势。随着相关领域的快速增长以及 GPU/TPU 等高级计算工具的出现,我们预计水文学家将越来越多地采用这些创新模型来解决与时间序列相关的问题。

  • (五)

    DL 方法可以帮助处理水文气候非平稳时间序列,这些时间序列经常出现“数据突发”、季节性、结构断裂和异方差性,这是传统统计预测中的关键挑战。因此,必须开发新的概念和模型,以适应水文气候时间序列的突然(不可预见)变化,以便做出决策。DL 模型通过将领域知识和隐藏模式集成到底层数据集中,提供了有前途的机会。

  • (六)

    在极端气候背景下,实时决策对于最大限度地降低水资源相关行业的风险至关重要。将 DL 与物联网 (IoT) 等新兴技术集成,可以为水资源社区的各种应用提供实时数据分析和决策能力。DL 模型可以在基于 Web 的实时框架中进行训练和部署,用于洪水预报和水资源管理等应用程序,使用 IoT 设备从传感器和卫星等各种来源收集和传输数据。

漫谈工程地质
本平台专注于工程地质领域研究前沿、专业技能、升学就业及地学资讯等内容。欢迎投稿与合作。小编VX:REG200602
 最新文章