第一作者:Bulat Kerimov
通讯作者:Bulat Kerimov
DOI:https://doi.org/10.1016/j.watres.2024.121933
文字摘要
数据驱动的元模型能够再现基于物理模型的输入-输出映射,同时大幅减少模拟时间。这些技术被广泛应用于水分配系统的设汁、控制和优化中。最近的研究强调了基于图神经网络(GNN)的元模型的潜力,因为它们能有效地利用水分配系统中的图结构特征。此外,这些元模型具备归纳偏置,有助于泛化到未见过的拓扑结构。可迁移的元模型对于需要高效评估多种备选布局的问题特别有利,或者在训练数据稀缺时尤为有用。然而,由于缺乏对管道层面发生的物理过程的表示,基于GNN的元模型的可迁移性仍然有限。为了解决这一局限性,该论文的工作引入了基于边的图神经网络(EGNN),这种网络扩展了归纳偏置集,并比传统的图神经网络更详细地表示链接级别的过程。这样的架构理论上与节点处的质量守恒约束相关。为了验证这一方法,作者测试了基于边的网络在估计管道流量和节点压力方面的能力,以模仿EPANET稳态模拟。首先,作者在几个基准水分配系统上将元模型的有效性与图神经网络进行了比较。然后,通过评估未见系统的性能来探索可迁移性。对于每种配置,计算了模型性能指标,如决定系数以及相对于原始数值模型的速度提升。结果显示,所提出的方法比基于节点的模型更准确地捕捉到了管道层面的物理过程。当测试具有相似需求分布的未知水网络时,该模型保持了良好的泛化性能,流速的决定系数高达0.98,预测水头的决定系数高达0.95。模型未来的发展可能包括同时推导出压力和流速。
图片摘要
Highlights
提出了一种新的基于边的图神经网络(EGNN)的元模型方法。
这种基于边的方法利用了质量守恒的归纳偏置。
EGNN在总体精度上优于图神经网络。
EGNN能够很好地泛化到未见过的拓扑结构,并保持良好的精度。
关键字:Water networks;Artificial intelligence;Transfer learning;Deep learning;Graph Neural Networks;EPANET
水力模型对于水分配系统(WDS)的设计、管理和控制至关重要。这些基于物理的模型,如EPANET,通过求解质量守恒和能量守恒方程来估计系统在任何给定时间的稳态流量和压力。然而,这些模型在需要大量模拟的应用中可能过于耗时。为解决这一问题,数据驱动的元模型可以显著减少模拟时间,同时保持与原始模型结果的可比性。机器学习方法,特别是人工神经网络(ANN),能够近似物理模型的输入-输出关系,在短时间内获得准确结果。尽管ANN利用了高程、管道粗糙度等参数,但它们忽略了WDS的拓扑信息及其连接性,这对准确建模和模型迁移是至关重要的。
图神经网络(GNNs)提供了一种新的解决方案,能够处理基于图数据集的非欧几里得结构,并考虑图的拓扑。GNNs扩展了深度学习对图拓扑的考量,通过引入邻接矩阵或拉普拉斯矩阵,并具有置换等变性质,适用于任意大小的图。这些特性保留了图结构中的额外信息,减少了可训练参数数量,使模型更轻量级。GNNs已被应用于多种水系统问题,包括爆管检测、分区计量区域划分和识别网络攻击。研究表明,GNNs能够在多个水网络上学习共享表示,但在新领域的实用性仍然受限。
目前关于训练模型可迁移性的证据有限。一个足够可迁移的元模型可以在网络修改后无需重新训练,并能应用于任意布局和配置的网络。文献中的研究通过同时在多个水网络上训练ChebNet模型,探索了基于GNN的元模型的可迁移性。虽然GNNs能在不同WDS中学习共享表示,但在新领域的实用性仍受限。这种局限性主要源于GNNs在建模管道内物理过程时的表现力不足。为此,本研究提出了一种基于边的图神经网络(EGNN),它在边空间上操作,以提高对物理过程的表达能力。通过这种方法,作者能够在给定消费节点的需求和管道参数下预测每条管道的流量,并进一步推导出每个节点的压力。实验结果显示,EGNN不仅提高了预测准确性,还在未知设置下表现出了良好的泛化能力。
GNN模型
编码器 (ENC) 的目的是将输入Xn转换为特征矩阵H
处理器 (PRC) 考虑拓扑结构,在此高维空间中处理特征矩阵H
解码器 (DEC) 将处理后的特征矩阵H投影到所研究的压力P的一维输出上
编码器:使用多层感知器(MLP) 来将输入特征Xn编码到更高维空间中。MLP 中的每一层都使用线性变换和非线性函数对特征矩阵进行变换,从而增强特征表示并提高模型的表达能力。编码器并行预处理节点特征,不包括拓扑信息。
处理器:特征矩阵可以通过将移动算子(shift operator)与特征矩阵相乘,从一个节点传播到其邻居节点。移动算子是一个矩阵,其元素定义为:当 属于 时,;否则,。通常,任何连接矩阵都可以作为移动算子,无论是邻接矩阵 还是拉普拉斯矩阵 。其中, 是节点度数的对角矩阵。多次应用移动算子可以允许信号从更大的跳数邻域中传播。接收场(即层数)越宽,信息在图中传播的范围就越广,如图1所示。
解码器:最后,解码器 从最后一层的隐藏特征矩阵中获得所需的输出 。
基于边缘的图神经网络元建模
GNN 和 EGNN 的泛化
图4总结了模型评估的结果。正如预期的那样,在子集A(条形图顶部)上训练的模型的性能高于子集B(条形图底部)。基于边缘的方法在流量方面始终优于基于节点的GNN。就连接头和压力而言,当参数发生变化时,EGNN更有可能提供可靠的结果(子集B)。
EGNN的可迁移性
图6. 以Apulia(a, b)和Jilin(c, d)为例,对可迁移性的详细评估,每个案例研究平均进行了(n=100)次模拟。左侧显示了真实f与预测f的比较;以及p与$\hat p$的比较。右侧展示了网络布局,节点和边的颜色分别表示推导出的压力和水头损失的平均绝对误差(b, d)。
点击“原文链接”,查看论文
声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!
邮箱:environmodel@sina.com
若您认为有用,欢迎
将Environmodel设为星标,或
点击“在看”或“分享”给他人