第一作者:Yipeng Wu
通讯作者:Shuming Liu
DOI:https://doi.org/10.1016/j.watres.2024.121999
文字摘要
在严重漏水问题背景下,研究人员专注于开发基于深度学习的声波漏检技术。然而,这些研究往往优先考虑模型开发,而忽视了数据的重要性。这项研究探讨了数据增强技术对基于深度学习的声波漏检技术的影响。提出了五种随机转换基本方法——抖动、缩放、扭曲、迭代振幅调整傅里叶变换(IAAFT)和屏蔽。抖动、缩放、扭曲和 IAAFT 直接处理原始信号,而屏蔽则在时频谱图上运行。来自现实世界 WDS 的声信号被增强,并使用卷积神经网络分类器验证其有效性,以识别声信号的光谱图。结果显示,在数据分割前实施数据增强的重要性,以防止数据泄露和过于乐观的结果。在这些技术中,IAAFT 脱颖而出,显着增加了数据量和多样性,提高了识别准确率超过 7%。屏蔽主要通过迫使分类器学习光谱图的全局特征来提高性能。IAAFT 和屏蔽的连续应用进一步增强了漏检性能。此外,当将复杂模型应用于声波数据时,数据增强也可以通过迁移学习提高漏检的有效性。这些发现从数据中心的角度推进了人工智能驱动的声波漏检技术的发展,朝着更成熟的应用方向发展。
图片摘要
Highlights
探索了时间和时频域内的声学数据增强。
分割前的数据增强防止了因数据泄露而导致的偏斜结果。
IAAFT 将精度提高了 7%,非常适合用于声学泄漏检测。
IAAFT 和掩码的顺序使用协同作用,以提高性能表现。
Keywords:
Water distribution system;Acoustic leak detection;Data augmentation;Convolutional neural network;Time–frequency spectrogram
数据增强技术
图 1.数据增强技术概述
用于泄漏检测的深度学习分类器
CNN分类器是声学泄漏检测任务中使用最广泛的深度学习模型。如图 2所示,典型的CNN分类器包括卷积层、池化层、全连接层和输出层。在卷积层中,卷积核遍历二维频谱图,逐点与每个区域的元素相乘,然后将结果聚合以获得一个值。这些由滑动卷积核生成的值共同形成一个特征图。池化层用作卷积后生成的特征图的特征压缩器。这种压缩有助于降低计算复杂度并从卷积输出特征中提取重要信息。卷积层和池化层之间可以有各种组合,包括一对一或多对一配置。在本研究中,数据增强技术的评估主要基于时频CNN (TFCNN) 分类器,该分类器具有两个卷积层、一个最大池化层、两个全连接层(分别有 512 个和 256 个神经元)和一个输出层。
该研究比较两种条件下 TFCNN 分类器的性能:使用先实现分帧的数据的 TFCNN 分类器称为 TFCNN-post-splitting,而使用先实现数据拆分的数据的 TFCNN 分类器称为 TFCNN-pre-splitting。如图3所示,TFCNN-post-splitting的性能明显优于TFCNN-pre-splitting,凸显了数据拆分和分帧中实施顺序的重要性。防止分类器可能会在训练阶段从不可用或看不见的数据中收集信息,从而导致有偏差的乐观结果。这种现象通常被称为数据泄漏。
图 3 . TFCNN 分类器在两种条件下的性能:一种在将原始信号拆分为训练、验证和测试数据集后实现分帧(即预拆分),而另一种在将原始信号拆分为训练、验证和测试数据集之前实现分帧(即后拆分)
为了评估数据泄漏的发生,采用广泛使用的相似性度量余弦相似性来分析增强帧的时频谱图(展平为矢量)。图 4说明了来自同一信号的不同帧的频谱图之间(即,帧内相似性)以及来自不同信号的帧之间(即,帧间相似性)的余弦相似性的分布。
图 6.不同数据增强技术的增强数据与原始信号的频谱图余弦相似度。框中的数字代表中值。
点击“原文链接”,查看论文
声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!
邮箱:environmodel@sina.com
若您认为有用,欢迎
将Environmodel设为星标,或
点击“在看”或“分享”给他人