Feng YP(Feng Yuanpeng),Jiang ZS(Jiang Zhansi),Tang ZY(Tang Zhenyu),et al.Rolling Bearing Fault Diagnosis Based on MResNet-LSTM.[J]Internatinal Journal of Acoustics and Vibrration,2024,29:125-133.
摘要
针对强噪声环境下滚动轴承故障特征弱、工况复杂多变的挑战,提出了一种诊断方法。该方法将多尺度残差神经网络(MResNet)和长短期记忆(LSTM)神经网络相结合,实现了恒转速和变转速工况下轴承的故障诊断。首先,完成一个集成经验模式分解与自适应噪声(CEEMDAN)应用于振动信号去噪。
其次,在多尺度残差块之间引入dropout层防止网络过拟合,并结合LSTM强大的时间序列信息捕获能力提高诊断精度;最后,利用恒速和变速轴承数据集进行了实验验证。结果表明,该方法在转速条件发生变化、信号受噪声污染严重的情况下仍能保持较强的诊断能力。
引言
滚动轴承是机械系统的基本部件。在轨道交通、航空航天等应用领域,轴承的运行环境复杂多变,成为易发故障部件。机械故障如果不能及时诊断,可能会对人体安全造成不可预知的损害因此,对滚动轴承进行故障诊断,对于保障生命财产安全,提高机械设备的工作效率具有重要的现实意义在实际生产过程中,滚动轴承有两种运行条件:恒速和变速。基于振动信号分析的轴承故障诊断方法中,特征提取和故障分类是关键环节。主流的特征提取方法,如小波变换、经验模态分解和短时傅立叶变换等,更多地依赖于专业知识。传统的分类器,如支持向量机和人工神经网络,由于其网络结构较浅,故障识别率较低。此外,轴承转速的变化使采集到的信号源表现出明显的非平稳特征,使得传统的轴承故障诊断方法难以识别故障类型。对于变速问题,采用信号处理技术检测变速情况下的故障。计算阶迹法(COT)是一种常用的处理变速信号的方法,它将变速振动信号在角域中重新采样为平滑信号。
近年来,卷积神经网络(Convolutional Neural Networks, cnn)在故障诊断领域受到了学者们的极大青睐。2016年,CNN开始用于轴承故障诊断Zhang等提出了一种带有训练干扰的卷积神经网络(convolutional neural network with training interference, TICNN)来解决真实工业环境中机器工作量变化和噪声问题。浅CNN网络可能无法捕获复杂的特征和模式,并且CNN网络中的层堆叠可能导致梯度消失或爆炸问题。因此,Zhao等人利用深度残差收缩网络来解决深度网络中梯度消失或爆炸的问题。通过在深度结构中插入软阈值,消除噪声相关特征,实现强背景噪声故障诊断。Zhi等结合小波域相关阈值对传感器数据中的噪声进行抑制,利用CNN提取数据特征,并结合LSTM强大的时间序列数据处理能力实现谐波减速器故障检测。
轴承振动信号在不同的时间尺度上可以表示不同的特征,使用多尺度网络可以捕获不同尺度和频率的特征。Zhao等利用带注意机制的多尺度模块构建共享特征生成器,形成了带微分鉴别器的深度多尺度对手神经网络,并验证了该网络具有优异的诊断性能。Wang等人提出了一种融合多模态传感器信号的创新方法,利用1D CNN从原始振动信号和声学信号中提取特征,通过特征融合提高了轴承故障诊断的精度。Huang等将通道关注机制加入到多尺度CNN中,通过最大池化层和平均池化层提取信号的多尺度信息,实现噪声环境和不同运行速度下的轴承故障诊断。Liu等将稀疏小波分解与多尺度神经网络相结合,显著提高了诊断准确率。Qi等将EMD与多尺度CNN相结合,利用金字塔池模块重新提取丰富的互补特征进行轴承故障标签评估。
上述CNN模型在轴承故障诊断中取得了较好的诊断效果,但仅适用于轴承转速恒定的情况,不能实现变速条件下的轴承故障诊断。在现实中,机械设备的运行环境中也可能混杂着大量的噪声,从而降低了故障诊断的精度。针对上述问题,本文提出了一种多尺度残差网络与LSTM相结合的故障诊断方法(MResNetLSTM)。该方法通过COT对变速轴承振动信号进行角域变换,利用CEEMDAN对故障信号进行降噪,并在残差块之间引入dropout层,去除网络中的部分冗余信息,防止过拟合,提高诊断效率。它利用不同大小的卷积核提取更丰富的特征,并利用残差结构解决模型中的梯度爆炸问题。
本文提出的方法能够在存在噪声干扰的恒定和变速工况下实现滚动轴承的自适应特征提取和端到端诊断。
基本方法
长短期记忆网络(LSMN)
LSTM是一种特殊的递归神经网络(RNN)循环结构,最初由Hochreiter和Schmidhuber在20世纪90年代末提出LSTM主要解决RNN的长期依赖问题,包括遗忘门、输入门和输出门。结构示意图如图1所示。
CEEMDAN的基本原则
CEEMDAN是在集合经验模态分解(EEMD)的基础上提出的,有效地解决了EEMD中的模态混叠现象。CEEMDAN的步骤如下:
步骤1:在待分解信号x(t)中引入正态分布的高斯白噪声δi(t),构造N次待分解序列xi(t)。其中i = 1,2,3,…, N。
步骤2:对上述序列进行EMD分解,取一阶模态进行均值计算,得到CEEMDAN的一阶模态分量。
计算第一个残差分量。
步骤3:对r1(t)引入高斯白噪声,对新信号rj−1(t)+εj−1Ej−1(δi(t))进行EMD分解,提取CEEMDAN中的二阶模态分量。
计算第二个残差分量。
步骤4:重复步骤3,得到第j个模态分量。
步骤5:当残差分量rn(t)为单调信号时,停止迭代,结束CEEMDAN算法的分解。
CEEMDAN去噪过程
本文使用的CEEMDAN去噪流程图如图2所示。通过CEEMDAN将带有噪声的信号分解为多个IMF分量。然后,计算各分量的自相关系数。对自相关系数大于0.2的分量进行重构。
计算顺序轨道
计算顺序轨道假定它的参考轴在一段时间内具有恒定的速度。轴的角度θ可以用下面的二次方程来描述:
式中系数b0、b1、b2为待解系数,通过拟合连续三个关键相量到达时间(t1、t2、t3)与轴向角变化值∆φ确定。可以建立如下方程组:
代入可得:
一旦系数b0, b1,b2确认得到:
一旦确定了重采样的时间,就可以通过三次样条插值计算出相应的信号幅度。
基于mresnet-lstm的故障诊断模型
改善残余结构
如图3(a)所示,当网络层数过多时,传统的残差结构容易出现过拟合。ResNet结构如图3(b)所示,在残差块之间引入dropout层以缓解过拟合。每个残差块包括三个卷积层,BN层和激活层,利用Elu作为激活函数。与relu相比,Elu的输出平均值接近于零,收敛速度更快。
MResNet-LSTM模型
为了从原始振动信号中提取不同尺度的深层特征信息,防止因网络层数增加而产生梯度消失。本文结合多尺度ResNet强大的特征提取能力和LSTM在捕获故障发生时间信息方面的优势,提出了MResNet-LSTM。MResNet-LSTM的结构图如图4所示。
网络结构包括初始卷积层、池化层、MResNet层、池化层、特征融合层、LSTM层、展开层、全连接层、dropout层和分类层。
MResNet-LSTM故障诊断流程
针对旋转机械工作环境中噪声较大的问题,由于采集到的滚动轴承振动信号与噪声混合,特征提取不够充分,提出了一种用于滚动轴承故障诊断的MResNet-LSTM网络。故障诊断流程图如图5所示。基于MResNet-LSTM的故障诊断流程如下:
1.对于轴承等速运行时的振动信号,为了模拟实际工作环境,在振动信号中加入高斯白噪声,然后使用CEEMDAN去噪。
2.对于变速工况下的轴承振动信号,为了模拟实际运行环境,在振动信号中加入高斯白噪声。利用COT对振动信号重采样为角域信号,然后利用CEEMDAN对对角域信号去噪。
3.将去噪后的信号分为训练集、验证集和测试集,然后进行唯一的热编码标记处理。
4.训练集训练神经网络,从模型中提取特征信息,学习故障特征。
5.利用验证集对模型参数进行微调,训练后得到故障诊断模型。
6.将测试集作为模型的输入,输出故障诊断结果,完成故障诊断过程。
实验验证及结果分析
恒速轴承故障诊断
实验设计和数据采集
本实验使用的试验台是Spectra Quest Co的机械故障模拟器(Mechanical Fault Simulator, MFS),如图6所示。
它主要由信号采集和速度控制软件系统、驱动电机、转速计、加速度传感器和故障轴承组成。故障轴承类型为ER12K。在等速条件下,测试轴承的采样频率设置为12.8 kHz。轴承内圈、滚动元件和外圈分别有故障。在各故障状态下,它们的旋转频率分别为19.88 Hz、29.87 Hz和39.84 Hz。共有10种不同类型的轴承可供选择,其中包括正常条件下的轴承。
轴承在等速工况下的故障类型和故障代码见表1。每种故障轴承有327680个采样点,样本长度为1024。每一种故障轴承可分为320种样本,共计3200个数据样本。
实验参数设置
将数据集样本分成训练集、验证集和测试集,分别使用70%、20%和10%的比例。在实验中,优化器使用Adam,学习率设置为0.005,衰减率设置为0.01,分类层的激活函数使用softmax,训练批大小为64。
对于图3 (b)中改进的残差结构,dropout层按一定比例随机丢弃网络中的神经元,使得异常数据学习的机会更小,概率更低。drop rate设置过低会限制其有效性,而设置过高则会显著降低输出特征,导致训练不足。本文将改进残差结构中的drop - out率设置为0.1、0.25、0.35和0.5,并使用MResNet-LSTM模型验证drop - out率对诊断准确率的影响。结果如表2所示,精度为10次试验的平均值。从表2可以看出,在dropout率为0.25时,诊断准确率达到峰值,是最高的。因此,改进残余结构中的丢弃层的丢弃率为0.25。
对于恒转速条件下的轴承故障诊断,模型参数详见表3。使用的池化技术是最大池化,使用的激活函数是ELU。
实验结果
恒速条件下轴承的训练和验证集的精度和损失如图7所示。模型经过20次迭代后,训练集和验证集的准确率均接近100%,损失值保持相对稳定,表明模型已经收敛。
为了明确模型对测试集中各种故障的识别效果,利用混淆矩阵将测试集结果可视化,如图8所示。MResNet-LSTM对轴承的预测结果与标签基本一致。在等速条件下,仅对旋转频率为29.86Hz的滚动体故障发生诊断错误。
利用t-SNE验证MResNet-LSTM对轴承故障数据集的特征学习能力,如图9、图9(a)、图9(b)所示,原始状态下的轴承数据非常混乱,混合数据种类繁多,难以区分。在输出层中,10个样本被完美分离,同类型样本被完美聚类,表明该模型具有较强的特征提取能力。
比较实验
为了验证MResNet-LSTM的有效性,将其与其他不同的方法进行比较。具体比较方法如下:WKCNN、WDCNN、CNN、ResNet-18。
表4给出了实验结果,其中准确率为5次测试的平均值。从表4可以看出,在等速条件下,MResNet-LSTM的平均准确率达到99.41%,超过了其他对比方法。
抗噪声性能分析
为了验证MResNetLSTM的抗噪声性能,将信噪比分别设置为-4dB和-2dB。与上述四种方法相比,分类准确率为5次测试的平均值,如图10所示。
如图11所示,由于噪声干扰,故障诊断的准确率有所下降。在信噪比为-4dB和-2dB的情况下,MResNet-LSTM模型对恒速轴承的平均诊断准确率仍为89.72%和91.13%,高于其他比较方法。五种试验结果的稳定性也优于其他比较方法。
变速轴承故障诊断
实验设计和数据采集
变速轴承的故障诊断实验装置与恒速轴承相同,采用Spectra Quest公司的机械故障模拟器(MFS)。在实验室中采集了变速轴承外圈故障、内圈故障和滚子故障三种振动信号。采样频率为25.6kHz,旋转频率从0增加到40Hz。表3显示了变速工况下轴承的故障类型和故障代码。每种故障轴承有360448个采样点,样本长度为1024。每种故障轴承类型可分为320个样本,总计960个数据样本。
实验参数设置
将数据集样本分成训练集、验证集和测试集,分别使用70%、20%和10%的比例。在实验中,优化器设置为使用Adam,学习率设置为0.005,衰减率设置为0.01,分类层激活函数使用softmax,训练批大小为24。表5显示了变速工况下轴承的故障类型和故障代码。
实验结果
变速条件下轴承的训练集和验证集的精度和损失如图11所示,训练集和验证集的精度都接近100%。
为了明确该模型对变速故障轴承测试集中各种故障的识别效果,采用混淆矩阵将测试集的结果可视化。如图12所示,MRes-Net-LSTM对轴承的预测结果与标签基本一致。在变速条件下,诊断错误只发生在外圈故障。
使用t-SNE验证MResNet-LSTM在变速轴承故障数据集上的特征学习能力如图13所示。从图13(a)和(b)可以看出,各种类型的数据在输入层呈现混沌状态,而三种故障类型在输出层是完美分离的。该模型对变速轴承故障数据具有较强的特征提取能力。
比较实验
为了验证MResNet-LSTM方法的有效性,将角域信号作为输入,并将MResNet-LSTM方法与上述四种方法进行比较。同时,利用计算阶数跟踪完成了变速信号重采样的有效性验证。在MResNet-LSTM中加入了以振动信号为输入的对比方法。表6显示了准确度为5次测试的平均值的结果。从表6中可以看出,将变速轴承振动信号计算阶次轨迹并重采样为角域信号作为输入数据,可以提高网络的诊断精度。将角域信号作为MResNet-LSTM模型的输入,在变速条件下的平均诊断准确率达到98.44%,高于其他比较方法。
抗噪声性能分析
为了验证MResNet-LSTM在变速条件下的抗噪声性能,信噪比也分别设置为-4dB和-2dB。与上述四种方法相比,分类准确率为5次测试的平均值,如图14所示。
如图14所示,在信噪比分别为-4dB和-2dB时,MResNet-LSTM对变速轴承的平均诊断准确率分别为91.77%和92.92%,优于其他比较方法。
结论
针对强噪声环境下滚动轴承故障有效诊断的挑战,提出了一种基于MResNet-LSTM的轴承故障诊断方法。该方法将多尺度残差网络强大的特征提取能力与LSTM的时间序列分析能力相结合。它可以在恒定和可变转速条件下进行故障诊断,同时也显示出强大的抗干扰性能。分析得出以下结论:
1.在恒速轴承数据集上验证了多尺度ResNet和LSTM相结合的诊断方法。实验中测试集的平均诊断准确率达到99.41%。此外,在变速工况轴承数据集上,平均诊断准确率达到98.44%。
2.该模型在振动信号中存在较强噪声的情况下仍能保持较高的诊断准确率,有效降低了噪声对识别结果的影响。
3.通过在残差块之间添加dropout层去除网络中的冗余信息,防止过拟合,提高诊断效率,增强模型的泛化能力。
推荐阅读 | 用于非平稳信号时频特征提取的自适应线性 chirplet 同步提取变换
推荐阅读| 旋转的秘密:相位移编码器破解目标检测中的边界之谜
推荐阅读 | FeatAug-DETR:通过特征增强丰富DETRs的一对多匹配