Yu T, Li C, Huang J, et al. ReF-DDPM: A novel DDPM-based data augmentation method for imbalanced rolling bearing fault diagnosis[J]. Reliability Engineering & System Safety, 2024, 251: 110343.
有效的轴承故障诊断对确保机械系统的安全性和可靠性至关重要。由于复杂和恶劣的工作环境,机械数据通常来自不平衡的数据集,这是诊断应用中的一个紧迫问题。然而,现有的主要基于生成对抗网络(GAN)的数据增强方法在生成样本的质量和多样性之间的平衡方面仍然存在挑战。为了解决这一问题,本文提出了一种新的数据增强方法,称为重参数化残差去噪扩散概率模型(ReF-DDPM),并将其应用于故障诊断。该模型包括一个前向扩散过程和一个反向去噪过程,通过马尔可夫链将高斯噪声和原始样本进行转换。为了提高生成样本的质量,噪声预测网络进行了改进,以通过增强层内和层间特征来更好地表示特征。此外,在采样过程中,信号标签被添加到模型中作为条件信息,以指导相关类别样本的生成。研究为轴承不平衡数据提供了一种新的数据增强方法,生成的数据可以进一步用于故障诊断任务。验证实验表明,该方法在解决数据不平衡问题方面具有良好的效果,并提高了不平衡故障诊断的准确性。
引言
在工业领域,作为机械设备旋转部件的一个不可或缺的部分,滚动轴承由于设备运行条件的干扰,常常因为受力不均而极易发生故障。如果不能及时检测出故障情况,可能会导致损坏进一步加剧,严重威胁机械系统的安全运行,甚至导致重大的经济损失。因此,为了确保旋转机械系统的稳定运行和生产力,进行有效且准确的轴承故障诊断是至关重要的。
旋转机械的故障信号主要体现在振动信号中。传统的故障诊断方法主要关注振动信号的固有频率。然而,这些基于机器学习和信号处理的方法需要手动获取大量的专家知识,并且这些专家知识会因故障模式的不同而有所差异,这使得传统的故障诊断方法需要较长的准备时间,并且无法保证其准确性。最近,基于深度学习的故障诊断方法显示出了良好的性能,并被广泛应用于实际中。这些方法可以直接从故障数据中自适应地提取特征,避免了对大量专家知识的依赖。
一般来说,深度学习方法在学习特征时需要大量且均衡的不同类别的数据进行训练。然而,在工业中,由于机械设备通常处于健康状态或由于数据存储不当,很难获得足够数量的标记故障数据。相反,充足的健康数据导致数据类型不平衡,这对诊断模型在学习特征以识别故障时是一个重大挑战。因此,数据不平衡是机械故障诊断方法面临的一个重大挑战。一个有效的解决方案是扩展少数类的故障样本。数据增强可以提高故障诊断的精度。然而,基于GAN的数据生成方法容易出现模式崩溃问题,从而导致生成数据的多样性不足。此外,鉴别器和生成器之间的对抗训练模式容易导致模型进入不稳定状态,这需要对模型参数进行大量的人工调整。最终,这会导致在生成样本中从真实样本中学习的特征有限,并且扩展数据集的低质量会影响故障识别的准确性。此外,经典的数据生成方法如过采样技术中的合成少数类过采样技术(SMOTE)容易受到噪声影响,并存在过拟合的风险。在生成模型中,变分自编码器(VAE)可以通过潜在表示生成新样本。然而,由于重构损失的设置和训练的不稳定性,它在一定程度上削弱了生成样本的质量。近年来,元学习已被用于不平衡样本故障诊断,但需要大量的训练数据,且难以获得具有相似分布的数据以用于训练在少量故障数据情景下的场景。因此,研究一种新的数据增强方法以生成高质量的样本并提高故障诊断的整体性能是至关重要的。
最近,去噪扩散概率模型(DDPM)在图像合成和语音合成任务中获得了广泛的关注,并取得了可喜的成果。与基于GAN的方法相比,DDPM使用马尔可夫链训练模型以生成具有更大多样性和更稳定生成过程的样本。该方法包括一个前向扩散过程和一个反向去噪过程。在前向扩散过程中,DDPM逐步将样本加噪直至其转化为高斯噪声。在反向去噪过程中,高斯噪声逐步恢复为原始样本。通过直接学习数据分布并逐步优化训练策略,DDPM可以避免模式崩溃的问题。因此,DDPM在数据生成方面表现得更好。
综上所述,DDPM在其他领域中已能够有效生成数据。然而,生成振动信号的研究仍然有限,且受限于DDPM的噪声预测网络结构,它在局部特征信息的损失和全局特征信息的冗余方面存在不足。因此,本文提出了一种新的数据增强方法,称为重参数化残差去噪扩散概率模型(ReF-DDPM)。为了增强生成样本的质量,改进了噪声预测网络以更好地表示特征。首先,为了增强网络的层内特征,一个重参数化残差特征网络(RepRFN)被集成到采样模块中,该网络通过多尺度残差进一步提取不同感受野的特征,同时通过重参数化操作减轻参数规模。然后,为了增强网络的层间特征,将多头循环层注意力(MRLA)引入到跳跃连接中,替代基本的拼接模式。这加强了低层特征和高层特征之间的交互,并过滤了冗余的全局特征信息。为了提高模型生成的速度,将信号标签作为条件信息添加到模型中参与训练,并可以在采样过程中指导相关类别样本的生成。最终,生成的样本与原始样本混合以创建一个平衡的数据集以实现故障分类。所提出的方法有效避免了模式崩溃和训练不稳定的问题,并在保证样本多样性的前提下提高了样本质量。
基于以上分析和讨论,本研究的主要贡献总结如下:(1)本文提出了一种新的样本生成方法,能够生成高质量的振动信号以应对滚动轴承故障诊断中的数据不平衡问题。(2)采样模块中集成了重参数化残差特征网络,增强了网络的层内特征,并改善了模型的局部特征表示。(3)网络的跳跃连接通过多头循环层注意力进行改进,增强了高层特征与低层特征的交互,并有效提高了模型的生成能力。
接下来,本文将首先回顾所采用的方法论,然后详细介绍ReF-DDPM框架及其原理,随后使用实际数据集验证该方法的有效性。最后,本文总结了研究结论并提出了未来研究方向。
理论背景
去噪扩散概率模型 (DDPM)
DDPM是由Jonathan Ho提出的一种生成模型,它包括一个前向扩散过程和一个反向去噪过程。在前向扩散过程中,它逐步地将原始样本加入噪声,直到其转换为高斯噪声。这个过程可以被视为一个马尔可夫过程,其中当前时间步的样本仅与上一个时间步的样本和施加的噪声有关。原始样本和之间的关系可以通过重参数化公式得出:
其中。
在反向去噪过程中,高斯噪声逐渐恢复为期望的原始样本。这个过程要求模型预测逆分布。通过贝叶斯公式,可以推断出 和的分布服从均值为和方差的高斯分布,这不能直接求解。假设已知, ,和之间的关系可以通过重参数化公式反转得出:
其中均值的计算公式为:
因此,模型只需要估计噪声 。训练过程是优化以最大化:
取上式两侧的期望值:公式可以简化为:因为是常数,等于熵。然后,根据KL散度计算:其中是常数。上述公式可改写为:损失函数可以简化为:
多头循环层注意力
在原始扩散模型中,噪声预测网络的跳跃连接使用简单的连接模式在通道上聚合特征,忽略了层级间特征的关系。MRLA通过检索和查询层级间信息,加强了高级别和低级别特征之间的交互。如图1所示。
图1 MRLA的原理
注意力模型通常使用 Query-Key-Value (QKV) 模式来增强模型功能。给定作为第层的输出,执行每层的注意力机制,并使用不同的生成函数生成 Key 和 Value,如下:
层注意力计算为:
令,方程可以被重写为:其中。
提出的方法
本研究旨在开发一个使用ReF-DDPM生成具有原始特征的振动信号的框架,以解决不平衡诊断任务中故障样本数量不足的问题。网络结构如图2所示,具体步骤如下:
图2 使用ReF DDPM进行故障诊断任务的数据增强策略
步骤1:向不平衡故障数据中的训练样本添加噪声,经过时间步 生成样本。
步骤2:将, 和样本标签输入ReF-DDPM模型进行训练,以预测噪声值。
步骤3:训练完成后,从标准正态分布中采样并输入ReF-DDPM模型与时间步和样本标签一起用于数据生成。
步骤4:将生成的样本与训练样本混合,以补充少数类别的数据,形成平衡的数据集。
步骤5:将平衡的数据集输入分类器进行故障诊断。
ReF-DDPM框架设计
(1) 噪声预测网络的架构
噪声预测网络是决定扩散模型生成样本质量的关键,本研究中使用了U-Net架构。图3展示了该架构,主要包括DoubleConv模块、Downsample模块和Upsample模块。DoubleConv模块由两个3×3核大小的卷积层组成。Downsample模块对数据进行下采样以提取浅层特征,而Upsample模块对数据进行上采样以提取深层特征。深层特征和浅层特征通过跳跃连接进行融合。最后,通过1×1卷积输出预测的噪声。
跳跃连接使用MRLA机制增强低层特征和高层特征之间的交互。首先,通过平均池化和卷积将高层特征向量转换为三个特征向量矩阵(QKV)。然后,将特征向量矩阵Q和K相乘并归一化以获得注意力分布,再与特征向量矩阵V相乘以生成注意力特征矩阵。最后,将低层特征向量和注意力特征矩阵相加以计算特征向量。
图3 噪声预测网络架构
(2) 下行采样和上行采样模块的结构
为了提高噪声预测网络的层级特征提取能力,下行采样和上行采样模块的设计受到重参数化残差特征网络(RepRFN)的启发,如图4所示。
图4 (a)下行采样;(b)上行采样
在模块中,使用3×3核大小的卷积层提取浅层特征,然后是堆叠的重参数化残差特征块(RepRFB)逐步提取特征,如图5所示。图5(b)显示,RepBlock模块采用多并行分支结构。在模型训练过程中,使用3×3、3×1、1×3、1×1和1×1−3×3核大小的卷积层,相当于用3×3核大小的卷积层替换,这可以提取不同感受野的特征。此外,重参数化可以减轻模型采样过程中网络参数的规模。通过填充3×1、1×3和1×1卷积层并将其转换为3×3卷积层来实现。然后对1×1−3×3卷积层进行卷积,并将这些卷积层的权重和偏差相加并分配给一个新的3×3卷积层。通过3×3卷积提取深度特征后,RepRFB模块采用局部残差连接融合浅层和深层特征,最后使用注意力机制增强整体特征的表示。
图5 (a)RepRFB架构;(b) RepBlock;(c)注意层
模型训练和采样程序
ReF-DDPM模型的训练过程是训练噪声预测网络以获得预测的高斯噪声和之间的均方误差(MSE)。在本研究中,信号类别标签y被添加为模型条件,损失函数从公式(9)更新为:
算法1显示了训练算法的流程。
采样过程逐步去噪随机生成的数据。时间步t 的数据 是:
其中如果 , ,否则。经过迭代计算,最终生成数据 。算法2显示了采样算法的流程。
实验验证
CWRU数据集上的实验研究
(1) 感应数据集和数据准备
在这个案例中,选择来自凯斯西储大学滚动轴承故障模拟实验室的公开可用数据进行分析和验证。实验轴承安装在电机轴的两侧,一端是驱动轴,另一端是风扇轴。这里测试的选定轴承安装在驱动轴上的 SKF6205,速度为 1797 rpm,负载为 0 马力。样本长度为 512。收集的振动数据包括正常数据和内圈(IR)、球(BA)、外圈(OR)的故障数据,故障尺寸分别为 7 毫微米、14 毫微米、21 毫微米。表 1 提供了实验数据集的详细信息。图 6 显示了在三种故障条件下原始样本的轴承故障数据的频域和时域波形。
表1 CWRU的数据集详细信息
图6 轴承故障数据的时域和频域波形
模型训练周期设置为 300,每个初始故障类别训练数据集包含 20 个样本,用于生成指定数量的振动数据。所提出方法的参数设置如下:模型采用 Adam 优化器,初始学习率设置为 1e−4,批量大小设置为 36,扩散步设置为 1000。所提出网络模型的结构参数如表 2 所示。
表2 ReF DDPM的结构参数
(2) 数据生成质量评估
ReF-DDPM 模型旨在生成真实的轴承振动信号以增强数据。高质量的生成样本可以提高模型故障识别的准确性。因此,评估生成样本的质量是重要的。研究从以下几个方面进行全面评估。首先,考虑到振动信号的时频特性,时域和频域波形(TFDW)可以直观地反映信号的基本特性。然后计算评估指标,以量化生成样本与原始样本的相似性。最后,可视化显示真实训练样本和生成样本之间的特征分布差异。
考虑到实际运行,数据集是不平衡的,少数故障数据和多数正常数据。因此,研究只增强了故障条件下的数据。随机选择来自三种故障条件的原始数据和生成数据,生成时频波形进行比较分析。图 7、8 和 9 显示了 ReF-DDPM 模型和代表性生成模型 WGAN-GP 和 DDPM 的分析结果。
图 7 21mils外圈故障信号的时频域波形结果:(a) 原始数据;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM。
图 8 21mils内圈故障信号的时频域波形结果:(a) 原始数据;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM。
图 9 21mils内圈故障信号的时频域波形结果:(a) 原始数据;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM。
显然,所提出方法中的原始信号的波形特性得到了保留。WGAN-GP 生成的数据和 DDPM 在时域和频域上与原始数据有所不同。如图 7 所示,WGAN-GP 引入了一些噪声,DDPM 没有生成特定的频率。在图 8 和 9 中,WGAN-GP 容易忽略微小的低频成分,DDPM 的时域波形幅度不明显。此外,ReF-DDPM 在不同故障条件下生成的数据具有良好的多样性,这表明 ReF-DDPM 可以提供更好的生成能力,同时保持样本多样性,提高样本质量。
时频波形提供了对生成样本质量的直观评估,但缺乏定量准确性。为了准确评估样本生成的质量,研究使用了包括 Jensen-Shannon 散度(JSD)、最大均值差异(MMD)和余弦相似度(COSINE)在内的统计指标来量化 ReF-DDPM 的性能。表 3 显示了原始数据和生成数据之间的相似性结果。当 MMD 和 JSD 值较小且 COSINE 值较大时,表明分布差异较小。此外,随着生成数据的评估值接近原始数据的评估值,生成数据的分布与原始数据的分布相似。值得注意的是,原始数据的评估值和生成数据的评估值是通过将生成数据和测试数据与原始训练数据平均计算得出的。结果表明,ReF-DDPM 在 MMD 指标和 JSD 指标上的生成数据评估值小于其他方法,COSINE 值较大,表明 ReF-DDPM 方法比其他方法更好地学习了原始数据分布。此外,这些评估值与原始数据的评估值非常接近。表明 ReF-DDPM 的生成样本与原始数据极为相似。
表 3 多评估指标的相似性结果
为了更深入地了解不同健康条件下轴承数据特征的差异,使用 t 分布随机最近邻嵌入(t-SNE) 进行特征可视化。图 10 反映了生成样本和原始样本的特征分布,它们与平衡数据集一起。圆框表示样本别名,方框表示同一样本类中生成样本与原始样本的特征分离。在图 10(d) 中,生成数据的特征分布与原始数据几乎一致,并且不同状态的数据特征在类间具有良好的可分性。从图 10(a) 到 (b),可以看出样本特征在不同类别上有不同的交叉和类内分离。图 10(a) 中以粉色显示的生成数据(Generated 8)与原始数据(Real 8)分离,并与以橙色显示的生成数据(Generated 4)重叠。这表明 DCGAN 和 WGAN-GP 存在模式崩溃的问题。在图 10(c) 中,DDPM 避免了类内分离,但特征分布有轻微的别名。结果表明,ReF-DDPM 生成的数据特征与原始数据几乎一致,可以增强不平衡的数据集。
图 10 使用 (a) DCGAN、(b) WGAN-GP、(c) DDPM 和 (d) ReF-DDPM 的真实数据和生成数据的 t-SNE 结果
(3) 不平衡故障诊断的结果和分析
上述结果表明,ReF-DDPM 可以确保生成样本与原始样本几乎相同,这有利于提高诊断的准确性。为了验证该方法在不同程度不平衡的数据集中进行不平衡故障诊断的有效性,本研究采用了不平衡比率的定义,即少数类样本与正常样本的比率。实验数据集如表 4 所示。不平衡比率从 1:80 到 1:1,少数类训练数据集的初始样本为 2 个样本。将生成的数据与原始训练数据混合,以训练 2 层 CNN 模型并计算诊断的准确性。诊断结果在十次实验中平均。
表 4 不平衡实验数据集的详细信息
如图 11 所示,随着生成数据的增加,诊断的准确性大大提高。在 1:80 时,没有向模型中添加生成数据,测试准确率仅为 10.2%。这是因为由于少数类数据的稀缺,诊断模型学习到的样本特征不具有代表性。相比之下,它可以从多数类的样本中完全提取样本特征,这进一步降低了模型识别故障数据类别的可能性,导致整体故障准确率低。在 1:40 和 1:20 时,基于 GAN 的算法比基于 DDPM 的算法具有更高的分类准确率。这种现象的原因是,基于 GAN 的算法容易模式崩溃,导致单一生成样本。当样本稀缺时,它可以增加单一样本的特征提取概率,并最终使整体分类准确率高于基于 DDPM 的算法。当不平衡比率达到 1:10 时,所提出的方法获得了 56.7% 的准确率,而其他三种比较方法分别获得了 54.3%、55% 和 44.6% 的准确率。
图 11 四种方法不平衡故障诊断结果
从那时起,所提出的方法在分类准确率上显示出特别明显的优势。原因是由于样本多样性差,基于 GAN 的算法的单一样本分类优势无法弥补整体样本分类的缺陷,而 DDPM 算法生成的样本具有丰富的多样性,ReF-DDPM 算法可以完全提取样本的特征。随着样本增加到平衡,所提出的方法达到了 99.5% 的准确率,高于 WGAN-GP、DCGAN 和 DDPM 算法的 87.5%、81.3% 和 95.6%。实验结果验证了所提出的方法在解决轴承诊断中的数据不平衡问题方面的有效性。为了直观评估诊断的有效性,将平衡数据的分类结果绘制为混淆矩阵,如图 12 所示。结果表明,所提出的方法在故障诊断方面优于其他三种策略。
图 12 分类结果的混淆矩阵:(a) DCGAN;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM
(4) 消融研究
为了验证特征增强模块和注意力机制的有效性,设计了以下控制模型的消融实验:
其他模型结构保持不变,取消融合的 RepRFN 网络结构和跳跃连接中的 MRLA 注意力机制,即原始的 DDPM 方法,称为控制模型 A。 其他模型结构保持相同,仅取消融合的 RepRFN 网络结构,使用 DDPM 的 Upsample 和 Downsample 模块代替,称为控制模型 B。 其他模型结构保持相同,仅取消跳跃连接中的 MRLA 注意力机制,称为控制模型 C。 使用所提出模型中的模块,即本文的 ReF-DDPM 方法,称为模型 D。
图 13 显示了四种控制模型在平衡数据上的故障诊断结果。模型 A 在训练和分类准确率最低,损失值最高。相比之下,模型 B、C 和 D 的性能有了显著提高。模型 C 的性能优于模型 B,表明使用融合的 RepRFN 网络结构显著提高了诊断准确率。模型 D 显示出最佳的分类准确率,证明了所提出方法的有效性。
图 13 控制模型的故障诊断结果:(a) 训练准确率和损失;(b) 分类结果。
为了更好地反映所提出模型学习特征的能力,使用 t-SNE 对控制模型的测试结果的输出特征进行可视化,如图 14 所示。可以看出,测试样本的特征分布显示出明显的类内收敛和类间可分性,在图 14(d) 中。其他比较模型都显示出特征混合,模型 B 和 C 与模型 A 相比特征合并不太明显。这也证实了所提出方法在提取样本特征方面的有效性。
图 14. 模型的 t-SNE 特征可视化:(a) 模型 A;(b) 模型 B;(c) 模型 C;(d) 模型 D
MFPT数据集上的实验研究
(1) 感应数据集和数据准备
在这项研究中,选择由机械故障预防技术协会 (MFPT)提供的实验数据进行进一步的实验验证,其比 CWRU 更复杂。选择七个数据集,速度为 1500 转/分钟,包括正常 (N)、内圈 (IR) 和外圈 (OR) 数据。正常数据的采样频率为 97,656 Hz,故障数据的采样频率为 48,828 Hz。样本长度为 2048。表 5 提供了实验数据集的详细信息。
表5 MFPT数据集详细信息
图 15 显示了两种工作条件下原始样本的轴承故障数据的频域和时域波形。可以看出,MFPT 故障样本比 CWRU 具有更复杂的频率成分。
图 15 轴承故障数据的时域和频域波形
(2) 数据生成质量评估
模型训练周期设置为 300,每个初始故障类别训练数据集包含 10 个样本,用于生成指定数量的振动数据。随机选择来自两种故障条件的原始数据和生成数据进行比较分析。图 16 和 17 显示了 ReF-DDPM 模型和其他代表性生成模型 (WGAN-GP, DDPM) 的分析结果。可以看出,ReF-DDPM 的生成样本仍然保留了原始样本的波形特征。然而,WGAN-GP 生成的时域波形包含明显的噪声,并且无法提取特定频率。DDPM 生成的数据倾向于忽略某些频率。与图 16 和 17 相比,尽管数据复杂性增加,但 ReF-DDPM 生成的数据仍然可以提供更丰富的特征信息。
图 16 50 磅力下内圈故障信号的时频域波形结果:(a) 原始数据;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM
图 17 50 磅力下外圈故障信号的时频域波形结果:(a) 原始数据;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM
(3) 不平衡故障诊断的结果和分析
表 6 设置了诊断实验数据集。少数类的训练数据集最初包含 2 个样本,并且生成的数据与原始训练数据集混合,直到与多数类的数据集平衡。诊断结果在十次实验中平均。
表 6 不平衡实验数据集的详细信息
在 1:40 时,没有向模型中添加生成的数据,测试准确率仅为 14.8%。测试结果如图 18 所示。当生成的样本有限时,基于 GAN 的算法比基于 DDPM 的算法具有更高的分类准确率。随着生成数据的增加,所提出方法的准确率高于其他方法。在 1:1 时,所提出方法的准确率达到 78.4%,高于 WGAN-GP、DCGAN 和 DDPM 算法的 53.6%、53.1% 和 75.3%。实验结果进一步验证了所提出方法在处理复杂数据方面的优越性。
图 18 四种方法在不平衡故障诊断的结果
MFS数据集上的实验研究
(1) 感应数据集和数据准备
为了进一步展示所提出方法在实际应用中的有效性,分析了从机械故障模拟器 (MFS) 实验平台收集的数据。实验平台如图 19 所示。这个实验数据集包括正常数据 (N)、球故障数据 (BA)、内圈故障数据 (IR)、复合故障数据 (C) 和外圈故障数据 (OR)。实验数据集的详细信息列在表 7 中。旋转速度为 1800rpm。本研究以 24 kHz 的频率采样 10 秒。图 20 显示了原始样本的轴承故障数据的频域和时域波形。
图 19 MFS实验平台
表 7 MFS 数据集的详细信息
图 20 轴承故障数据的时域和频域波形
(2) 数据生成质量评估
模型训练周期设置为 300,每个初始故障类别训练数据集包含 10 个样本,用于生成指定数量的振动数据。随机选择原始数据和生成数据进行比较分析。图 21 显示了 ReF-DDPM 模型和其他代表性生成模型 (WGAN-GP, DDPM) 的分析结果。可以看出,ReF-DDPM 的生成样本基本上与原始数据的分布一致,而 WGAN-GP 在高频域生成了不相关的频率,DDPM 的时域波形的幅度不明显。这个结果进一步证明了 ReF-DDPM 在数据生成方面的优越性。
图 21 内圈故障信号的时频域波形结果:(a) 原始数据;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM
(3) 不平衡故障诊断的结果和分析
在图 22 中,平衡数据的分类结果被绘制为混淆矩阵。可以看出,ReF-DDPM 在故障诊断方面优于其他三种策略。
图 22 分类结果的混淆矩阵:(a) DCGAN;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM
如图 23 所示,使用 t-SNE 可视化输出特征,以直观评估诊断的有效性。所提出方法提取的特征在类间具有良好的可分性,并且在类内收敛,而其他方法的特征分布有不同程度的重叠。结果进一步表明 ReF-DDPM 可以生成具有特征一致性的振动信号,并提高不平衡诊断的准确性。
图 23 T-SNE 特征分布:(a) DCGAN;(b) WGAN-GP;(c) DDPM;(d) ReF-DDPM
结论和未来研究
为了解决不平衡的故障诊断问题,本文提出了一种新的数据增强方法,名为 ReF-DDPM,以提高故障诊断分类率。通过增强内部和外部层级特征改进了噪声预测网络,以获得更好的特征表示,从而提高了生成数据的质量。首先,将重参数化残差特征网络集成到采样模块中,通过多尺度残差进一步提取不同感受野的特征来增强网络的内部层级特征。然后,将多头循环层注意力融合到跳跃连接中,而不是基本的拼接方式,以增强网络的外部层级特征并过滤掉多余的全局特征信息。最终,公共和真实数据集上的验证实验结果表明,ReF-DDPM 在解决振动信号不平衡问题方面具有更高的生成多样性和诊断准确性,为不平衡滚动轴承故障诊断设计了一种新颖有效的方法。然而,扩散模型受到耗时的采样过程的限制。在未来的工作中,将进一步优化时间步,以减少采样步骤并提高扩散模型的采样速度。
推荐阅读
一种全新滚动轴承局部缺陷扩展动态更新和实时映射的数字孪生模型
无寿命标签下的RUL概率预测:一种融合贝叶斯深度学习和随机过程的方法
CBAM增强残差卷积域自适应网络在跨机滚动轴承剩余使用寿命预测中的应用