Ni Q, Ji J C, Halkon B, et al. Physics-Informed Residual Network (PIResNet) for rolling element bearing fault diagnostics[J]. Mechanical Systems and Signal Processing, 2023, 200: 110544.
摘要
近年来学者们开发了多种用于机器状态监测的深度学习方法,在轴承故障诊断方面取得了令人瞩目的成功。尽管能够有效地诊断轴承故障,但大多数深度学习方法都非常依赖大量的数据,在工业应用中并不总是可获取到的。在实际工程中,轴承通常安装在经常发生速度和负载变化的旋转机械中,导致难以在所有操作条件下收集大型训练数据集。此外,在大多数深度学习算法中,物理信息常常会被忽略,有时会导致生成的结果不符合物理定律。为了应对这些挑战,本文提出了一种新的物理信息残差网络(PIResNet),用于学习嵌入在训练和测试数据中的底层物理信息,从而为不完美的数据提供符合物理规律的解决方案。在所提出的方法中,首先采用物理模态特性主导生成层来生成模态特性主导特征。然后,构建域转换层,以实现在不同运行速度条件下提取能够判别轴承故障的特征。最后,建立了一个并行双通道残差学习架构,可以自动提取轴承故障特征。使用可变运行速度和可变负载以及时变运行速度下的实验数据集进行验证,证明了PIResNet在非平稳运行条件下的优越性。
引言
由于工业创新对自动化、集成化和精度的要求,现代工业对机械的可靠性和安全性提出了越来越高的要求。轴承是旋转机械中的关键部件,其能够支撑轴、约束相对运动和减轻旋转部件之间的摩擦,因此通常用于各种现代工业应用。在实际应用中,由于持续长时间运行、维护不当、承受旋转部件动态载荷引起的动态应力等原因,轴承的退化和故障是不可避免的。因此,轴承是旋转机械中最常见的故障部件之一。轴承的劣化或故障可能导致整个机械系统意外停机,从而导致生产率损失、维护或更严重的致命事故,从而产生巨大的成本。因此,准确诊断轴承故障对现代工业健康管理具有重要意义。
物理信息的整合有助于深度学习模型不仅从现有的观测(训练)数据中学习规则,而且从所有数据(包括测试数据)中学习基本的物理或领域知识,从而为不完美的数据(如从不一致的操作条件、噪声数据等收集的训练和测试数据)提供物理一致的解决方案。自提出以来,基于物理学的深度学习引起了爆炸式的关注。最前沿的应用之一可能是求解非线性偏微分方程。Raissi等人将潜在的物理定律整合到损失函数中,成功构建了一个计算效率高的神经网络,可以处理偏微分方程。此外,物理信息深度学习概念已被研究并嵌入各种应用实例中,如增强湍流模型、电力系统、天气和气候建模、辐射传输、拓扑优化等。
尽管物理信息深度学习网络能够解决在不同操作条件下承载训练和测试数据问题,但是建立这样一个网络仍然存在挑战,例如提取在不同操作条件下(本研究中的操作速度和负载)鲁棒的物理信息,并将这些物理信息嵌入到网络架构中。为此,本文提出了一种结合模态特性的物理信息深度学习网络。本文贡献如下:
(1)基于倒谱指数滤波建立了一个物理模态特性主导生成层,使模态特性在处理后的信号中占主导地位。模态特性仅与系统特性相关,其对操作条件的变化不敏感,但对系统的变化敏感,能够感知从健康状态到故障状态的变化或故障位置的变化,从而使得在不同的操作条件下建立稳健的网络工作成为可能。
(2)基于计算阶数跟踪(COT)建立域转换层,将时域信号转换为与转速无关的角度域信号。因此,域转换层能够减轻速度变化带来的影响,从而在可变或时变速度条件下提取有鉴别性的轴承故障特征。
(3)在前两步后建立并行双通道残差学习架构。这两个通道可以并行地从原始振动和模态特性主导信号中自动提取复杂的高维轴承故障特征,这可以在训练和测试数据之间存在分布差异时提高诊断精度。
本文后续部分的结构如下。第2节介绍了所提出的物理信息并行双通道残差网络的方法。第3节包括在可变和时变操作条件下进行的两次实验验证,以验证所提出方法的有效性。第4节总结了本研究完成的工作。
方法研究
卷积神经网络和残差网络
在各种深度学习方法中,CNN因其通过卷积和池化操作从原始数据中自动提取有鉴别性的轴承故障特征的独特优势,在轴承状态监测中得到了广泛的研究和应用。这使人们无需手动提取特征,为没有专业轴承故障机制知识的现场操作员提供了决策的可能性。由于原始轴承振动通常是一维的,本文采用一维(1D)CNN,下面将简要介绍。CNN的特征提取主要通过卷积层和池化层实现。
卷积层使用多个卷积核来提取特征,1D卷积层使用1D卷积核来卷积1D输入。如果有N个卷积核,则卷积将执行N次,每次卷积操作都将使用相同的卷积核对输入进行卷积,从而生成一个特征图。在第层,第卷积核的卷积操作可以表示为:
其中,和分别表示第层中第个卷积核的权重和偏差矩阵;表示第层中的第个输出特征图;表示第层中第卷积核的第输出特征图。
池化层旨在压缩局部特征的大小并提取最重要的信息。常用的池化层包括最大池化层和平均池化层。本文使用了最大池化层。如果池化运算符的长度为,则最大池化函数可以表示为:
其中,代表第层中第特征图池化操作后的输出。
残差网络,也称为ResNet,在解决深度学习的梯度消失问题方面很有帮助。ResNet是一种神经网络架构,其中残差构建块(RBB)是最基本的元素,它通过快捷连接将特征从上一层直接转移到下一层。图1(a)显示了一种典型RBB,图1(b)描述了本文采用的RBB。
如图1(a)所示,RBB可以表示为如下形式:
其中和分别表示RBB的输入向量和输出向量;代表残差函数。使用快捷连接可以显著增加网络的深度。此外,删除单层对残差网络的整体测试性能几乎没有影响。需要注意的是,和应该具有相同的维度,如果它们不在相同的维度上,快捷连接可以用的替代卷积层替换,以确保相同的维度。
物理模态特性主导特征提取
轴承故障信号通常是一系列“几乎周期性”的脉冲,本质上是强迫函数和传递函数的复合响应。强迫函数以与转速相关的速率重复自身,传递函数与具有固定共振频率的模态特性有关,这些特性与输入的幅度和频率无关,但会导致输入的放大。因此,轴承故障信息由共振频率携带和放大,本文设计了一个模态特性主导生成层,使携带轴承故障信息的模态特性占主导地位。模态特性主导生成层来自倒谱指数滤波,具体如下:
倒谱最初是为语音识别而开发的。由于其能够分离强迫函数和传递函数,因此随后被用于其他模态分析。一般来说,最常用的倒谱是复倒谱,除非特别提及,否则本文中的倒谱是指复倒谱。倒谱最广泛使用的形式之一是:
其中表示时间信号;表示的倒谱;与分别表示逆傅里叶变换(IFT)算子和傅里叶变换(FT)算子; 和是的振幅和相位,其中。如果仅保留振幅信息,则结果将产生“实倒谱”,这对原始时间信号是不可逆的。
对于单输入多输出(SIMO)系统,响应函数是时域中强制函数和传递函数的卷积:
其中和分别表示强迫函数和传递函数。
对进行傅里叶变换:
对执行对数运算,结果为:
的倒频谱是的傅里叶逆变换,可以表示为:
因此,响应信号的倒频谱是强制函数倒频谱和传递函数倒频谱的总和,从而可以将两者分开。
图2总结了本文使用的模态特性主导生成层。为了便于说明,时域中模态特性主导生成层前后的信号及其频谱如图3所示。强制函数将根据速度和负载变化而变化,而传递函数仅与系统属性相关。因此,提取模态特性主导信息会生成对速度和负载变化不太敏感但对系统变化敏感的特征,例如从健康状态到故障状态或故障位置的变化。这使得建立受操作条件影响较小的网络成为可能。
减缓速度变化
轴承故障通常位于内圈、外圈和滚珠上。本文考虑了这三种类型的故障。正如上一节所述,局部故障可以产生一系列“几乎周期性”的脉冲,故障信息嵌入在这个周期性频率中(即FCF)。通过轴承运动学,FCF可以通过以下公式计算:
其中,表示滚动体编号,表示滑动体直径,表示节径,表示接触角,表示轴旋转频率。根据上式,轴承的FCF可以看作是由轴承几何形状和故障位置决定的常数与轴旋转频率的乘积。随着应用和操作条件的日益复杂,对变速轴承的研究越来越多。如果轴承在变速下运行,FCF将相应地改变。处理变速情况的一种基本方法是COT,它是通过将具有恒定时间增量的时间信号重新采样为具有恒定角度增量的角度信号来实现的。如果将旋转轴用作参考,即将采样率从每秒的采样数转换为每轴旋转的采样数,则顺序谱(角度信号的谱)可以定义为参考频率的倍数:
根据上式,从时域到角度域的转换可以消除由转速变化引起的频率调制。因此,基于COT建立域转换层,将原始信号转换为角度域,从而减轻速度变化的影响。
基于物理信息的残差网络架构
基于物理模态特性主导生成层和域转换层,本文提出了一种物理信息残差网络。所提出的PIResNet的架构如图4所示,其由两个并行通道组成,其中左通道类似于传统的残差网络。左通道从域转换层开始,然后是宽核CNN层以抑制高频噪声,之后依次添加两个RBB和最大池化层。右通道从模态特性主导生成层开始,用于增强与系统内在属性相关且受操作条件影响较小的模态属性。右通道的其余部分与左通道相同,旨在从模态属性主导信号中自动提取复杂的高维特征。随后,左通道和右通道被展平并连接在一起,之后使用全连接层和softmax层进行分类。此外,使用交叉熵作为损失函数来学习类判别特征。在所提出的PIResNet中使用的一些重要超参数包括:Adam Optimizer,mini batch为128、训练周期为100、dropout为0.5、初始学习率为0.001(每20个训练周期乘以0.5)。
实验验证
为了证明所提出的PIResNet的有效性,开展了两个不同的实验进行了验证,包括在变速和变负载下运行的轴承和在时变速度下运行的轴承。
变速和变负载下轴承运行的实验验证
数据说明
如图5所示,本节使用从传动系诊断模拟器(DDS)收集的数据来验证PIResNet的优越性。DDS由四个主要部件组成,包括驱动电机、两级行星齿轮箱、两级并联齿轮箱和磁力制动器。DDS由驱动电机驱动,通过调整可以模拟速度变化。负载由磁力制动器提供,通过改变其电流产生不同的负载。在本文中,如表1所示,设置了三个不同的速度和三种不同的负载,总共产生了九种不同的操作条件。
健康、外圈故障、内圈故障和滚珠故障的轴承依次安装在并联齿轮箱的轴右侧。振动信号由三个加速计收集,采样频率为12800 Hz,采样时间为80 s。由于被检查的轴承位于并联齿轮箱的右侧,采用放置在并联变速箱相应侧的加速度计的振动进行分析。首先通过下式对振动信号进行归一化:
在物理模态特性主导生成层和域转换层(重采样频率设置为512)之后,信号被分成长度为2048、重叠为0.5的样本。需要注意的是,多个样本的构造是在域转换层之后执行的,而不是在原始信号之后执行的。这是因为,如果原始信号被分割成具有相同长度的样本,则在角度重采样后,样本长度将随着速度而相应变化。
比较设置
在本研究中,PIResNet是基于PyTorch库实现的。设置了四种轴承状态,包括健康(0级)、外圈故障(1级)、内圈故障(2级)和滚珠故障(3级)。通过分类精度来量化所提出方法的性能。通过一系列综合比较,证明了所提出方法的有效性。更具体地说,将所提出的PIResNet与以下方法进行了比较:
(1)与具有与PIResNet类似的网络架构,但没有嵌入物理模态属性的方法相比。为此建立了两个网络。第一个网络(表示为方法1,将在下文中使用)是在删除PIResNet的右通道的同时建立的,同时保持其他参数与PIResNet相同。第二个网络(表示为方法2,将在下文中使用)是通过将右通道替换为与左通道相同的结构,并保持其他参数与PIResNet相同而建立的。PIResNet和方法1的比较可以证明所提出的方法优于传统的纯数据驱动方法。然而,PIResNet和方法1之间有两个不同的因素,即网络架构(从一个通道到两个通道)和物理模态属性的嵌入。为了保证性能改进主要是由物理信息因素引起的,方法2的设计只有一个区别,即物理模态特性,这是一项对照研究,旨在证明引入模态特性主导生成层的优越性。
(2)与三种最先进的方法,包括DCNN、ResNet和WDCNN相比。本文使用的DCNN的研究架构主要采用五个卷积层和一个全连接层。本文使用的ResNet的研究架构主要由一个卷积层、两个RBB和一个全连接层组成。本文采用的WDCNN的研究架构主要涉及宽核第一卷积层、四个常见卷积层和一个全连接层。
结果演示和分析
在本节中,从三个不同方面评估了PIResNet的性能,包括(1)当所有操作条件都包含在训练数据中时,(2)当测试数据的操作条件不包含在训练资料中时,(3)当添加不同水平的高斯白噪声时。表2总结了这些场景中的任务。对于所有这些任务,重复计算五次。记录了这五次计算的平均精度和标准偏差。详细结果和讨论如下。
(1)包括所有操作条件时的诊断准确性。该案例评估了训练和测试数据之间没有分布差异时的性能,这是大多数深度学习方法成功的基本假设。在这种情况下,所有操作条件下的数据都被使用,其中随机70%是训练数据,其余30%是测试数据。表3显示了使用所提出的方法和其他比较方法的准确性。
(2)当测试数据的操作条件缺失时的诊断准确性。本案例旨在探索在轴承运行过程中常见的训练数据和测试数据之间存在分布差异的情况下的性能。在实践中,可能已经存储了各种操作条件下的大量数据,但并不可能在所有操作条件下收集数据。由于轴承通常在复杂的操作条件下运行,速度、负载或其他因素的轻微变化可能会导致新的操作条件。在这种情况下,来自一个操作条件的数据被用作测试数据,而来自其他操作条件的信息则被用于训练,详细实验条件信息见表2。表4列出了所提出的方法和其他方法的测试精度,可以反映可变负载和速度下的域适应性。
(3)不同信噪比(SNR)水平下的诊断准确性。本案例旨在研究PIResNet和其他方法对噪声的鲁棒性。将不同级别的高斯白噪声添加到原始信号中,以生成不同级别的信噪比,其定义为:
其中表示原始信号的功率,表示高斯白噪声的功率。信噪比等于5dB、0dB和-5dB时的测试精度如表5所示。
除了测试精度外,图6还显示了使用所提出的PIResNet进行任务A、任务B和任务C的混淆矩阵。在混淆矩阵中,每个单元都由同一真类的数量进行归一化。上述表格显示了五次试验的平均值和标准偏差值,而下图每个混淆矩阵显示了这五次试验中精度最高的结果。
从表3可以看出,如果没有分布差异,所有方法都可以达到很高的诊断准确率,其中最低的诊断准确度为97.18%。所提出的PIResNet具有最高的准确率,为99.59%。从表4可以看出,当测试集的操作条件不包括在训练集中时,所有方法的诊断准确性都会降低。在任务B1中,除PIResNet外,所有方法的精度都低于80%,部分原因是在零负载和相对低速的运行条件下,振动信号本质上很弱。在任务B中,所提出的PIResNet表现出卓越的性能,在9个任务中的7个任务上达到了最高的准确性。ResNet在任务B2和任务B9中的表现优于PIResNet,但在任务B2中,PIResNet可以达到第二高的精度;在任务B9中,所提出的PIResNet也可以达到很高的准确率(99.76%),这一结果是可以接受的。此外,任务B中PIResNet的总体平均准确率为95.62%,远高于ResNet。因此,PIResNet在可变负载和速度下表现出了出色的适应性。从表5中可以看出,所提出的PIResNet在各种信噪比情况下实现了最高的诊断精度,对噪声具有很高的鲁棒性。
时变转速下轴承运行的实验验证
数据说明
本节研究了所提出的方法在时变速度运行条件下的有效性。本节使用了从韩国科学技术院(KAIST)轴承试验台收集的数据。该实验通过调节电机的转速来模拟时变速度条件,电机的输出速度从680转/分钟随机变化到2460转/分钟。通过放电加工,轴承出现了外圈故障、内圈故障和滚珠故障,产生了四种不同的轴承状态(包括健康状态)。时变操作条件下的振动由水平和垂直安装在轴承B轴承室上的加速计收集。采样频率设置为25600 Hz,每种情况下共收集了2100秒的振动。
结果演示和分析
本节从两个任务中验证了PIResNet的优越性,包括:
(1)任务D:当随机70%的时变样本用作训练数据,其余30%的样本用作测试数据时。数据使用与第一次实验相同的程序进行处理,使用所提出的方法和其他比较方法的精度如表6所示。
(2)任务E:当添加不同水平的高斯白噪声时。表7总结了不同信噪比(5dB、0dB、-5dB)下的结果。此外,图7显示了利用PIResNet进行任务D和任务E的混淆矩阵。
从表6中可以看出,PIResNet的准确率最高,为97.78%。WDCNN、DCNN和ResNet的准确率分别达到96.91%,为95.50%和90.96%。因此,在时变速度条件下,PIResNet的表现优于其他方法。从表7中可以看出,当信噪比等于5 dB、0 dB和-5 dB时,PIResNet具有最高的诊断精度,这表明它可以在时变速度条件下对噪声进行鲁棒性测试。
在任务D、任务E1和任务E3中,方法1的准确率优于方法2,任务D与任务E的整体平均准确率均为84.08%。在本实验中,将网络架构中的一个通道更改为两个并行通道似乎并没有提高诊断准确率。这再次表明,与网络架构的改变相比,物理信息的结合有助于提高诊断的准确性。
结果总结
在本节中,我们使用了DDS测试台(在变速和变负载下)和KAIST测试台(时变速度下)的两个数据集来证明所提出的PIResNet的优越性。这两个实验涉及五种类型的任务,共有17个子任务。更具体地说,在任务A中,在所有操作条件下随机使用70%的样本作为训练数据(DDS数据集);在任务B中,测试数据的操作条件不包括在训练数据(DDS数据集)中;在任务C中,数据处于不同的信噪比水平下(DDS数据集);在任务D中,随机使用70%的时变样本作为训练数据(KAIST数据集);在任务E中,数据处于不同的信噪比水平(KAIST数据集)。可以得出结论:
(1)每项任务的最高精度来自所提出的PIResNet方法或ResNet方法;
(2)在17个子任务中,所提出的PIResNet在15个子任务中提供了最高的准确性;
(3)在17个子任务中,所提出的PIResNet在15个子任务中有较低的标准差,在任务E2与其他方法有相同的标准差。因此,所提出的PIResNet在大多数子任务中实现了最高的精度,并在大多数情况下具有较低的标准差,证明了其在可变或时变操作条件下有效处理分布差异和噪声场景的能力。
结论
本文开发了一种精确而稳健的轴承诊断框架,其中提出了一种具有高物理合规性的PIResNet。在所提出的PIResNet框架中,构建了一个新的物理模态特性主导生成层。物理模态特性主导生成层是在倒谱指数滤波的基础上开发的,它生成了由模态特性主导的特征。通过整合模态特性主导生成层,PIResNet不仅能够从现有的训练数据中学习特征,而且能够从训练和测试数据中嵌入的模态属性中学习特征。因此,它提供了一种物理一致性的解决方案,可以有效地处理不完美的数据,如分布差异。此外,引入了域转换层,将时间信号转换为角度信号,以进一步减轻轴承诊断中任何速度变化的影响。在所提出的PIResNet中,原始信号和模态特性主导信号的复杂高维特征被自动提取和融合,生成高精度且与物理一致的结果。轴承在变速和负载以及时变速度条件下运行的实验结果验证了所提出方法的性能。综合比较证实了PIResNet的出色性能,表明所提出的PIResNet是一种智能诊断方法,具有高精度、可变负载和速度的域适应性以及对噪声的鲁棒性,为工业轴承状态监测提供了优秀的物理信息解决方案。
推荐阅读
ReF-DDPM: 一种基于DDPM的滚动轴承故障诊断数据增强新方法
一种全新滚动轴承局部缺陷扩展动态更新和实时映射的数字孪生模型