Lu X, Jiang Q, Shen Y, et al. Enhanced residual convolutional domain adaptation network with CBAM for RUL prediction of cross-machine rolling bearing[J]. Reliability Engineering & System Safety, 2024, 245: 109976.
摘要
滚动轴承的剩余使用寿命(RUL)预测是确保机械设备可靠运行的重要措施之一。大多数现有方法都是基于同一机器在不同条件下的领域自适应(DA)RUL预测,但很少有跨机器的。领域自适应能够应对不同机器或其他条件下的数据分布差异(领域偏移),但潜在的负面迁移可能会影响DA和预测性能。因此,设计了一种增强的残差卷积领域自适应网络(ERCDAN)用于跨机器滚动轴承RUL预测。首先,设计了增强的残差卷积模块(ERCM)用于从有限数据中提取退化特征,并结合卷积块注意力模块(CBAM)来增强提取的特征。其次,设计了具有协作全连接结构和衰减多核最大均值差异的DA模块,以减轻负面迁移,实现有效的领域不变特征提取。最后,在PHM2012、XJTU-SY和EBFL数据集上进行了跨机器滚动轴承RUL预测的实验分析。结果表明,所提出的方法不仅可以有效地实现跨机器RUL预测,而且在相同机器的不同条件下也具有良好的跨轴承预测性能,反映了良好的泛化性能。
引言
故障预测与健康管理(PHM)是提高机械设备可靠性和使用效率的重要工具。其中,剩余使用寿命预测作为PHM的重要组成部分,能够为操作和维护决策提供宝贵的建议和指导,从而确保机械设备的可靠运行和效率。在工业实践中,滚动轴承作为旋转机械的关键部件,在复杂工况下因高速和重载等因素经常发生故障,进而导致机械系统故障。此外,据统计,约有一半的旋转机械系统故障是由轴承故障引起的。因此,预测滚动轴承的RUL并根据从预测中获得的退化趋势和RUL给出预测性维护策略,对于提高机械设备的可靠性和效率至关重要。
近年来,滚动轴承的RUL预测方法得到了广泛研究,当前的RUL预测方法主要是基于模型和基于数据驱动的方法。其中,基于模型的方法旨在基于故障机制,从观测数据中建立数学或物理模型来描述系统退化。然而,它们高度依赖专家知识,并在建模过程中容易受到复杂系统的限制,这使得建模的准确性难以保证。数据驱动方法主要使用机器学习和深度学习技术,从传感器数据中提取隐藏的退化特征,以预测滚动轴承的退化过程和RUL。数据驱动方法具有对专家知识依赖性低和对运行条件限制较少的优点,这使它们在工程应用中更具吸引力。
然而,现有的数据驱动方法通常在假设训练和测试数据独立同分布的前提下实现RUL预测,但实际上滚动轴承在实际运行中可能受到各种因素的影响,如不同的速度和负载,以及伴随其从运行到故障的形态变化,导致在不同条件下收集的振动信号数据中的退化特征存在分布差异,即领域偏移。这对数据驱动方法提出了挑战,并阻碍了预测模型对新工作条件甚至新机器的泛化。领域自适应作为迁移学习的一个分支,为领域偏移下的RUL预测提供了解决方案,基于DA的RUL预测受到了广泛关注。
大多数现有的数据驱动方法在相同机器上进行基于DA的跨条件RUL预测研究,并取得了令人满意的结果,但很少有跨机器相关的研究。然而,在实际应用场景中,经常遇到目标机械设备在运维过程中缺乏先前运行数据的情况,这增加了运维的难度和成本。假设如果能够有效利用其他机械设备的先前数据来完成目标机械设备的RUL预测,而无需先前数据,那么将大大节省成本,并提高可靠性和效率。
在实际工程中,由于缺乏先前运行数据,可能会出现可训练资源(可训练轴承数据)稀缺的情况,这使得难以确保有足够的数据来训练预测模型。针对这种情况,提出了一种基于增强残差卷积领域自适应网络(ERCDAN)的端到端跨机器滚动轴承RUL预测新方法。该方法对可训练资源的依赖性较小,即使用由有限轴承数据组成的训练集来实现对未标记轴承的有价值预测结果。此外,尽管DA通过减少数据分布差异克服了领域偏移,但其潜在的负迁移可能会影响领域不变特征提取和预测性能,因此在ERCDAN中设计了负迁移缓解方案。主要贡献如下:
1.设计了一种增强残差卷积模块(ERCM),有效地从有限的轴承数据中提取退化特征,并使用卷积块注意力模块(CBAM)来增强退化特征。相应地,设计了一个带有MK-MMD的DA模块来克服领域偏移。
2.为了克服特征学习过程中的负迁移效应,在RUL预测器和DA模块之间增加了协作全连接结构,并为MK-MMD损失设计了衰减惩罚机制。
3.构建了一个基于ERCM、CBAM和衰减MK-MMD的ERCDAN模型,有效地提取领域不变退化特征,实现跨机器滚动轴承RUL预测。
4.在PHM2012、XJTU-SY和实验轴承全寿命(EBFL)数据集上的实验验证了所提出的RUL预测方法的有效性,有效地实现了在未标记目标领域中的RUL预测能力,具有良好的泛化性能。
提出的RUL预测方法
问题描述
对于具有先前运行数据的机器上收集的数据,定义为源域,包含个标记样本。对于在没有先前运行数据的其他机器上收集的数据,定义为目标域,包含个未标记样本。其中和分别代表源域数据和目标域数据在特征空间中的数据分布。由于它们的收集条件不同,它们的数据和数据分布也不同,即且。本文提出的方法旨在将标记的源域中的监督信息转移到未标记的目标域,生成,以帮助完成目标域的RUL预测。具体来说,就是通过学习源域和目标域之间的领域不变特征来构建映射函数,以便在目标域测试时,能够预测与实际RUL相似的值,即。
概述
为了实现跨机器滚动轴承的RUL预测,本文提出了一种基于增强残差卷积领域自适应网络(ERCDAN)的RUL预测方法,如图1所示。ERCDAN通常分为三部分。首先,为了提高网络模型从有限轴承数据中提取退化特征的能力,设计了增强残差卷积模块(ERCM)。其次,为了克服原始信号中冗余信息对退化特征提取的影响,使用CBAM进行退化信息增强,并将ERCM与CBAM结合构建特征提取器。然后,为了克服领域自适应过程中可能的负迁移,并实现有效的领域不变特征提取,设计了负迁移缓解方案:1) 在特征提取器、RUL预测器和DA模块之间设计了协作全连接结构;2) 为MK-MMD损失设计了指数型衰减惩罚系数。
图1 增强残差卷积域自适应网络(ERCDAN)
增强残差卷积领域自适应网络
增强残差卷积模块
卷积神经网络(CNN)在图像特征提取任务中平移不变性成功应用,为基于一维振动信号的轴承RUL预测提供了启示。然而,在可训练资源缺乏的情况下,这要求预测模型具有强大的特征提取能力,从有限的轴承数据中有效提取退化特征。这为CNN提出了更高的性能要求,传统结构的CNN因此面临挑战。同时,对于RUL预测任务,收集的振动信号是轴承从运行到故障的生命周期数据,因此它是时序的。因此,需要改进CNN结构,增强其特征表示能力,并具备一定的时序信号处理能力,以便更好地进行特征提取,更适合基于有限轴承数据的振动信号RUL预测任务。
为增强CNN模型的特征表示能力,通常可以通过增加每个卷积层的通道数来增加网络宽度,或通过增加网络层数来增加网络深度。然而,这两种方法都有一定的局限性。例如,增加每个卷积层的通道数可以提高网络模型的表示能力,但少量增加通道数对性能提升有限。而将通道数增加一个数量级虽然可以显著提高性能,但会大幅增加计算负担。此外,随着网络层数的增加,可能出现目标函数容易陷入局部最优、过拟合和梯度消失等问题,导致网络性能下降,影响预测性能。
针对上述缺点,提出以下改进方案:(1) 针对通道数的增加,在每个卷积块中增加Conv-BN卷积层,如图2虚线框中所示的Conv-BN-Conv-BN。使用两个Conv-BN卷积层模拟大通道卷积层,以提高网络的特征表示能力。同时,卷积层的叠加增加了网络的深度,一方面扩大了网络的感受野,有助于特征表示,另一方面也增加了网络性能下降的风险。(2) 为解决网络层数增加导致的网络性能下降问题,使用残差结构替代原结构中的Conv-BN-Conv-BN-ReLU-MaxPool卷积块,即在Conv-BN-Conv-BN变换前的输入与变换后的输出相连,然后进行激活-池化操作。基于以上方案,设计了增强残差卷积模块(ERCM),如图2所示。
图2 增强残差卷积域自适应网络(ERCDAN)
同时,ERCM考虑了振动信号中存在的时序信息。RUL预测任务中使用的生命同期数据通过两层卷积滤波,尽管移除了原始信号中的一些冗余信息,但其中的时序信息也可能受损,这将导致网络性能下降。由于残差结构将滤波后的输出与原始输入连接,它可以补充原始输入的时序信息,增强网络模型的时序信号处理能力,使所提出的ERCM更适合RUL预测任务。
CBAM注意力机制
考虑到原始信号中存在冗余信息,这将影响退化特征的提取。为了增强提取的退化特征,使用具有自适应特征校正能力的CBAM来增强退化特征中的关键信息,并将CBAM与ERCM结合形成特征提取器。
CBAM是一种结合了通道和空间注意力机制的混合注意力机制。对于给定的特征图,CBAM可以在通道和空间两个维度上串行化注意力特征图信息,然后将两个特征图的信息与之前的输入特征图相乘或相加,进行自适应特征校正,以生成最终的特征图。对于RUL预测,它可以在从振动信号中提取特征时过滤退化特征的关键信息,提高提取特征的质量,并增强网络的特征提取能力。
CBAM的整个过程如图3(a)所示,其中主干网络的特征映射定义为。CBAM中通道注意力机制的1D通道注意力特征映射为。空间注意力机制的2D空间注意力特征映射为。
图3(b)和(c)分别阐述了通道注意力和空间注意力机制的原理。对于通道注意力机制,首先对输入特征进行avgpooling和maxpooling操作,生成的两个特征分别定义为和。然后将这两个特征输入到具有Conv-ReLU-Conv结构的共享网络中,生成最终的特征图。对于空间注意力机制,首先在通道轴上对输入特征进行maxpooling和avgpooling操作,生成的两个2D特征图分别定义为和。然后,将这两个特征图拼接起来,进行卷积和sigmoid激活,生成最终的2D空间注意力图。
图3 CBAM的详细信息:(a)CBAM的概述,(b)通道注意机制的原理,(c)空间注意机制的原则
无监督领域自适应与负迁移缓解
在跨机器条件下收集振动信号数据时,由于不同机器平台的固有特性、不同的旋转速度和负载等因素,收集到的振动信号数据存在分布差异。为了有效地实现跨机器RUL预测,需要解决领域自适应中的领域偏移问题。为了解决上述问题,所提出的方法通过计算源域和目标域特征之间的MK-MMD来减少分布差异,以解决领域偏移问题并实现无监督领域自适应。
尽管领域自适应可以在一定程度上解决领域偏移问题,但也需要缓解潜在负迁移的有害影响。也就是说,当两个数据分布之间的分布差异很大时(例如,当轴承的退化趋势很大时)。如果过分依赖领域自适应来减少数据分布差异以解决领域偏移,当源域和目标域的特征不对齐时,可能会增加对预测模型的影响,同时也会增加潜在负迁移的不良影响,进而影响预测模型的训练稳定性和最终预测性能。
因此,本文提出了一种负迁移缓解方案:(1) 在特征提取器、RUL预测器和DA模块(如图1所示的FC1和FC2_1)之间设计了一种协作全连接结构,参数不共享,以避免MK-MMD在损失反向传播过程中对RUL预测器的影响。(2) 为MK-MMD损失设计了指数型衰减惩罚系数,如图1所示,在网络训练的早期阶段,通过MK-MMD损失在总损失中较大比例产生的较大DA增益,帮助学习领域不变特征并实现领域自适应。随着训练迭代次数的增加,MK-MMD在总损失中的比例逐渐减小,减弱了DA增益对网络的影响,增强了网络的稳定性,并更多地依赖于由ERCM与CBAM组成的特征提取器和RUL预测器进行特征学习和RUL预测,从而实现负迁移缓解并增强特征学习。构建的网络的领域自适应损失计算和指数型衰减惩罚系数如下:
其中,是特征提取器的参数,是领域自适应模块的参数,是全连接层FC1,是迭代次数,是最大迭代次数。值得注意的是,设计的是一个从1平滑衰减到大约0.5的衰减系数。这样的设计是为了在缓解潜在负迁移的有害影响的同时,也让预测模型能够在一定程度上关注领域自适应。这是为了避免由于在训练后期缺乏对领域自适应的关注,导致目标领域特征学习不足,进而导致模型性能下降。
训练优化目标
在构建的训练模型中,来自源域和目标域的数据样本被输入到由ERCM和CBAM组成的特征提取器中。然后,特征提取器生成的源域和目标域特征被输入到领域自适应模块中,以计算MK-MMD损失,减少数据分布差异,并将生成的源域特征输入到RUL预测器中以计算预测误差。预测误差损失函数定义如下:
其中,是RUL预测器的参数, 是预测的RUL值,是样本对应的实际RUL值。然后,上述特征提取器、RUL预测器和DA模块结合成所提出的ERCDAN模型。基于上述模块的参数、和,并结合上述损失函数,所提出的ERCDAN模型的总损失目标函数定义为:
为了优化损失目标函数并获得最优模型,最终目标是确定参数 ,使它们满足:
使用Adam优化器更新模型参数,直到损失接近期望值。的更新方程如下:
其中η是学习率。跨机器RUL预测的ERCDAN模型的训练过程如算法1所示。
算法1 所提出的ERCDAN模型的训练过程
基于ERCDAN的跨机器滚动轴承RUL预测
所提出的方法主要分为三个阶段:数据处理、模型训练和RUL预测。每个阶段的具体描述如下:
第一阶段:数据处理。以固定长度采样不同机器上收集的各种滚动轴承的振动信号,封装采样的数据样本,并根据不同的轴承将它们划分为源域和目标域数据集。尽管模型可以直接从原始信号中提取退化特征,但可能包含冗余信息,并可能存在干扰信号,如噪声污染,这将增加训练难度并影响RUL预测结果。因此,采用了相应的数据处理方法:(1) 对生成的源域和目标域数据集,在采样后对每个实验轴承的寿命百分比进行标记;(2) Z-Score 标准化可以消除数据分析中数据幅度带来的不便,避免数据幅度对预测结果的影响,并且可以应用于数值数据。因此,在采样集上进行采样时,对收集的样本进行Z-Score标准化。
第二阶段:模型训练。首先,将训练集中源域的标记数据和目标域的未标记数据输入到共享特征提取器中。然后,使用源域提取的标记特征计算预测误差损失,并使用提取的源域和目标域特征执行无监督领域自适应损失计算。最后,根据计算出的损失,通过反向传播更新网络模型的参数。重复上述步骤,在迭代训练时保存最优模型,并在达到设定的最大迭代次数后停止训练。
第三阶段:RUL预测。直接将目标域测试集数据输入到训练好的模型中,执行跨机器滚动轴承RUL预测任务,使用预测结果和真实标签绘制RUL曲线,并基于各种评估指标评估所提出方法的预测性能。
实验分析
本节在IEEE PHM 2012轴承数据集、XJTU-SY轴承数据集和EBFL数据集上进行实验,以验证本文提出的RUL预测方法的有效性和泛化能力。首先,对这三个数据集进行了跨机器RUL预测实验,以验证所提方法的跨机器RUL预测性能。此外,为了进一步验证所提方法的有效性和泛化能力,本文在相同机器不同条件下的PHM和XJTU数据集上进行了跨轴承RUL预测实验。
实验设置
数据集介绍
数据集1:PHM2012数据集由FEMTO-ST研究所提供,包括在PRONOSTIA平台上完成的17个轴承的相关监测数据(如图4(a)所示),在三种不同条件下从运行到故障,如表1所示。通过固定在轴承外圈上的加速度传感器获得运行至故障的振动信号。采样频率为25.6 kHz,采样间隔为10秒,持续时间为0.1秒。这意味着每次采样包含2560个数据点,当振动信号的幅度超过20 g时,测试停止。
数据集2:XJYU数据集在图4(b)所示的加速退化实验平台上获得,其中可调节的条件主要包括径向力和旋转速度。该数据集包含15个轴承在三种不同条件下(如表1所示)的完整生命周期振动信号数据,振动信号由轴承的水平和垂直方向上的加速度传感器获得。采样频率为25.6 kHz,采样间隔为1分钟,每次采样持续1.28秒。
数据集3:EBFL数据集来自图4(c)所示的实验轴承全寿命试验台。该试验台的可调节条件主要是径向载荷和旋转速度。在此试验台上对6308单列深沟球轴承进行了全寿命实验,采样频率为25.6 kHz,采样间隔为30秒,持续时间为1秒。实验过程分为两个阶段,即加载-加载和恒定载荷阶段,如表1所示。
图4 滚动轴承退化实验:(a)PRONOTIA平台,(b)加速退化实验平台,(c)实验轴承全寿命试验台
表1 PHM2012、XJTU和EBFL数据集的描述
使用上述三个数据集设计了跨领域RUL预测任务,包括不同机器下的跨轴承RUL预测任务,以及相同机器不同条件下的跨轴承RUL预测任务,这些任务的源域训练集均由仅来自一个轴承的数据组成,以模拟可训练资源有限的条件。所有跨领域任务如表2所示。然后,使用这些任务对所提方法进行模型训练和预测性能测试,以验证其有效性和泛化能力。对于每个任务,使用源域中的所有标记数据和目标域中部分未标记数据进行模型训练,目标域中的其余数据用于性能测试。
在表2中,“/”表示“或”。每个任务的命名设置基于表2中源域和目标域轴承的顺序。例如,PX1代表源域P1_1和目标域X1_1的跨机器任务,以此类推到PX6(PX2:P1_1→X1_2 … PX6:P1_1→X3_1)。XP1代表源域X1_1和目标域P1_1的跨机器任务,以此类推到XP6(XP2:X1_2→P1_1 … XP6:X3_1→P1_1)。其他任务也按照这一逻辑设置。
表2 跨域RUL预测任务描述
性能评估指标
为了有效评估所提方法的预测性能并量化预测结果,使用了三个评估指标:均方根误差(RMSE)、平均绝对误差(MAE)和决定系数R²(R-Square)。RMSE和MAE是两个常用于衡量预测模型在连续数据上预测精度的指标。RMSE表示预测值与实际值之间偏差的平均程度,MAE表示预测值与实际值之间绝对误差的平均值。此外,由于RMSE是通过将误差值平方后求和再开方计算的,因此对异常值更敏感。RMSE和MAE越小,预测值与实际值之间的误差越小,即回归拟合效果越好。R²反映了通过回归关系可以解释的因变量变化的比例,也称为拟合优度。R²的值越接近1,回归拟合效果越好。
实验参数
实验使用原始的一维振动信号作为每个网络模型的输入,在进行Z-Score标准化处理后输入网络模型进行训练。根据以往的经验调整并选择所提方法的网络参数。参数设置如下:所有模型均使用Adam优化器进行训练,学习率设置为0.001并采用学习率衰减策略,批量大小设置为128,权重衰减参数设置为3e-6,最大迭代次数设置为200。所提出的网络模型的结构参数如表3所示。
表3 所提出的ERCDAN的网络架构参数
消融实验分析
为了验证所提出的ERCDAN的RUL预测性能,本文在ERCDAN的不同组件的不同模块和结构上提供了消融实验分析。以下消融实验均使用表2所示的共31个跨轴承RUL预测任务,包括跨机器、相同条件和不同条件,并使用RMSE、MAE和R2作为性能分析标准。
主干网络比较
为了验证所提出的ERCM的有效性,本文在仅改变主干网络的情况下,使用所提出的RUL预测方法框架内的所有31个跨域RUL预测任务进行实验和性能分析。以下主干网络的结构和参数分别显示在表4和表3的ERCM中。
如图5和表4所示,与方法1相比,方法3通过在每个卷积块内增加一层Conv-BN来增强网络的特征提取能力。然而,网络的整体性能下降,在这些四种方法中表现最差。这表明网络模型的时序信号处理能力没有得到增强,甚至被削弱,也表明仅依靠线性叠加结构来提高CNN不适用于RUL预测。尽管方法2在传统CNN结构中增加了残差结构,但其性能与方法1相比并没有提高。因此,仅仅将传统CNN结构改进为残差结构或线性叠加结构,不能有效提高网络模型的性能,反而导致网络性能下降。
将方法3改进为残差结构后,所提出的ERCM显著提高了网络性能,表明残差结构可以补偿方法3的时序信号处理能力不足,并在这四种方法中表现最佳。这验证了所提出的ERCM的有效性,与CNN、ResNet和线性叠加网络(LSCNN)相比,所提出的ERCM具有更好的退化特征提取能力,更适合RUL预测任务。
表4 不同主干网络的结构和参数
图5 主干网络比较实验结果的量化:(a) RMSE, (b) MAE, (c) R2
惩罚系数比较
为了在网络训练期间缓解负迁移,所提出的方法设计了指数型衰减惩罚系数,并将其分配给MK-MMD损失,以便在反向传播期间不断减少其在总损失中的比例,达到缓解负迁移的目的。为了验证这种设计的有效性,不同的惩罚系数(指数型放大系数:, 固定系数:0.25、0.5、1)替换所提出方法中的衰减系数,在相同条件下进行模型训练和性能研究。如图6所示,随着惩罚系数λ的增加,网络性能提高,表明较小的MK-MMD比例对应较小的增益,不利于实现领域自适应。与相比,放大系数对应的性能略差,这也表明MK-MMD的早期增益较小,不利于实现领域自适应。然而,在后期增加MK-MMD的增益加剧了网络的不稳定性,也不利于实现领域自适应。当惩罚系数设置为衰减形式时,早期阶段较大的MK-MMD增益用于帮助实现领域自适应,后期阶段增益逐渐减少以帮助提高稳定性。最终所提出的模型在所有指标上表现最佳,稳定性最好,表明衰减惩罚系数的有效性。
图6 量化惩罚系数比较实验结果:(a) RMSE, (b) MAE, (c) R2
不同模块比较
为了证明所提出方法中每个模块和结构的有效性,进行了相应的消融实验。不同模块(s)和结构(s)组成的方法的详细信息如下:(1) 方法1:LS-CNN。(2) 方法2:ERCM。(3) 方法3:ERCM + 协作全连接 + 衰减MK-MMD,没有CBAM。(4) 方法4:ERCM + CBAM,没有协作全连接,衰减MK-MMD和RUL预测器共享全连接层FC2_1。(5) 方法5:ERCM + CBAM,没有协作全连接,衰减MK-MMD和RUL预测器不共享全连接层FC2_1但没有FC1。(6) 所提出的方法:ERCM + CBAM + 协作全连接 + 衰减MK-MMD。
表5和图7显示了所提出方法与移除特定模块(s)和结构(s)后的方法的定量结果比较。首先,可以看到,通过残差结构改进线性叠加卷积网络后,ERCM的总体平均RMSE、MAE和R²值高于LS-CNN,稳定性更好。其次,移除注意力机制后,所提出的方法由于缺乏过滤退化特征关键信息的注意力机制,导致网络模型的整体性能下降。此外,方法4由于衰减MK-MMD和RUL预测器之间共享全连接层,在反向传播期间受MK-MMD的影响,导致RUL预测的最终输出更容易受到负迁移的误导,导致性能不佳。最后,方法5衰减MK-MMD且与RUL预测器不共享全连接层,与方法4相比有所改进,但两者都不如所提出的方法。这验证了协作全连接结构可以有效地减弱负迁移的影响,增强RUL预测的鲁棒性。
表5 不同方法的总体平均性能的定量结果
图7:性能量化可视化:(a) RMSE, (b) MAE, (c) R2
图8显示了结构消融实验中各种方法的RUL预测可视化效果。从图8中可以看出,所提出方法预测的RUL曲线能更好地拟合实际RUL线。从图8(a)、(h)和(k)中可以看出,方法4由于衰减MK-MMD和RUL预测器共享全连接层,在反向传播期间受MK-MMD的影响,导致RUL预测值的最终输出更容易受到负迁移的误导。局部RUL曲线的预测趋势与实际RUL相反,甚至出现严重的预测误差,如图8(b)和(e)所示。从图8(a)和(e)中可以看出,方法4和方法5都表现出与实际RUL相反的RUL曲线预测趋势,而所提出的方法没有表现出与实际RUL相反的RUL曲线预测趋势,表明所提出方法中设计的协作全连接结构在缓解负迁移方面的有效性。
图8:不同任务上RUL预测性能的可视化:(a) PX1; (b) PX4; (c) PB; (d) XP1; (e) XP4; (f) XB; (g) P1.1; (h) P1.3; (i) P2.4; (j) X1.1; (k) X1.4; (l) X2.3
比较实验分析
为了进一步衡量所提出方法的跨机器RUL预测性能,实验中提供了以下方法作为比较。非领域自适应方法,方法1:基于CNN的方法;方法2:基于CNN-Attention的方法;方法3:基于CNN-LSTM的方法。领域自适应方法,方法4:基于CORAL的方法;方法5:基于DAN的方法;方法6:基于DANN的方法。CNN-Attention中的注意力机制与所提出方法中的相同。此外,为了进一步验证所提出方法的有效性和泛化能力,在相同机器不同条件下的PHM和XJTU数据集上进行了跨轴承RUL预测实验作为补充验证。
跨机器实验
表6和图9-10显示了所提出的与六种比较方法在14个跨机器RUL预测任务上的性能。从表6的定量结果来看,基于RMSE、MAE和R2三个指标,所提出的方法相比表6中的其他6种比较方法展现出更好的整体性能提升和更佳的泛化性能。
表6 所有跨机器任务的实验结果图9 跨机器任务PX1–6和任务PB:(a)RMSE,(b)MAE,(c)R2图10 跨机器任务XP1-6和任务XB:(a)RMSE,(b)MAE,(c)R2
从图9和图10可以看出,所提出的方法在这些跨机器RUL预测任务上相比其他方法有更加均衡的性能,反映了所提出方法的有效性。与CNN相比,所提出方法在整体平均RMSE上降低了42.3%,在整体平均MAE上降低了44.7%,在整体平均R²上提高了89.8%。图11展示了所有比较方法与所提出方法在跨机器RUL预测任务上的性能可视化。根据图11,可以看出所提出的方法能够在面对跨机器滚动轴承RUL预测任务时有效预测目标域轴承的退化趋势和RUL。结合图11和图12,可以观察到当两台机器收集的轴承退化趋势相似(领域偏移小)时,例如任务PX3和XP3,尽管所提出的方法与比较方法相比没有显著改进,预测的RUL波动较小,预测结果更稳定,能拟合更真实的RUL曲线。然而,当轴承的退化趋势变化显著时,可能会导致网络模型性能下降,不同方法可能表现出显著的性能差异,例如任务PX4、PX6、XP1和XP2。特别是对于任务PX4,结合图12,可以看出两个轴承的退化趋势存在显著差异,这也导致比较方法无法有效预测退化趋势和RUL,而所提出的方法预测了更准确的退化趋势和RUL。其中,方法1、2和3没有将源域知识迁移到目标域,因此无法预测准确的退化趋势和RUL,但也没有表现出负迁移,如图11(d1)所示。当方法4、5和6减少分布差异时,目标域被源域信息误导,导致负迁移,如图11(d2)所示。相比之下,所提出的方法依靠设计的负迁移缓解方案有效抑制负迁移的发生,并预测了更准确的退化趋势和RUL。
图11 跨机器任务上RUL预测性能的可视化。(a1&2) PX1; (b) PX2; (c) PX3; (d1&2) PX4; (e) PX6; (f) PB; (g) XP1; (h1&2) XP2; (i) XP3; (j) XB图12 跨机器轴承的振动信号:(a) PHM:轴承1_1,(b) XJTU:轴承1_1,(c) XJTU:轴承1_2,(d) XJTU:轴承1_3,(e) XJTU:轴承1_4,(f) XJTU:轴承2_1,(g) XJTU:轴承3_1,(h) EBFL:B2
对于任务PX6、XP1和XP2,所提出的方法的预测结果更稳定且更接近实际RUL。对于任务PB和XB,如图11(f)和(j)所示,当其他方法显示性能下降时,所提出的方法仍然保持了良好的预测性能。此外,对于任务PX2,结合图11(b)和图12(c),可以观察到由于两个轴承在运行中期的退化趋势存在显著差异,导致网络模型的性能下降。尽管所提出的方法没有实现最佳的预测效果,但它与其他方法预测的RUL曲线相似。根据上述定量结果和性能可视化分析,非领域自适应比较方法在面对领域偏移问题时将性能下降,但可以避免负迁移,而领域自适应方法可以通过减少分布差异提高预测性能,但不能解决潜在的负迁移问题。所提出的方法结合了两者的优点,使其能够保持更好的预测性能和更好的鲁棒性,并且能够很好地执行滚动轴承的跨机器RUL预测。
同一机器上的跨轴承实验
在不同的应用场景中,这些方法可能表现出性能差异和不同的泛化性能。为了进一步验证所提出方法的有效性和泛化能力,本实验使用PHM2012和XJTU数据集上相同和不同条件下的跨轴承RUL预测实验作为补充性能验证。图13和图14显示了这些方法在两个数据集上两种不同条件下的跨轴承RUL预测任务的性能量化结果。
根据图13和图14,可以看出基于RMSE、MAE和R²三个性能指标,所提出的方法在相同机器上所有不同条件下的RUL预测任务上展现出最佳的整体性能,尽管它没有在每个任务上都实现最优的预测结果,并且在其他方法的性能下降时,所提出的方法仍然能够保持良好的预测稳定性和准确性。实验结果表明,所提出的方法不仅在相同条件下的跨轴承RUL预测任务上表现良好,而且能够更好地实现跨条件的RUL预测,并且也验证了所提出方法的有效性,具有良好的泛化性能。
图13 相同条件下,交叉承载任务P1.1-1.5和任务X1.1-1.4:(a)RMSE,(b)MAE,(c)R2图14 交叉条件交叉承载任务P2.1-2.4和任务X2.1-2.4:(a)RMSE,(b)MAE,(c)R2
结论
针对跨机器条件下可训练资源有限的问题,以及跨机器条件和领域自适应可能导致的领域偏移和潜在负迁移问题,本文提出了一种基于ERCDAN的跨机器滚动轴承RUL预测方法。基于ERCDAN的所提方法依赖ERCM从有限的轴承振动信号数据中提取退化特征,并利用CBAM增强退化特征的关键信息。设计的DA模块由协作全连接结构和衰减MK-MMD组成。协作全连接结构确保RUL预测器在学习领域不变特征时不受MK-MMD损失的影响,从而避免目标域被源域信息误导。同时,衰减MK-MMD确保在早期训练阶段有足够的跨领域信息以实现领域自适应,以使网络模型的稳定性和领域自适应的有效性不会随着迭代次数的增加而受到影响。
然后,通过消融实验验证了ERCDAN在退化特征提取和负迁移缓解方面的合理性和有效性。最后,在PHM2012、XJTU-SY和EBFL数据集上进行了跨机器RUL预测实验,以验证所提方法的性能。实验结果表明,与CNN相比,所提方法在跨机器任务上的RMSE和MAE指标分别降低了42.3%和44.7%,在R²指标上提高了89.8%,并且在相同机器不同条件下的PHM2012和XJTU-SY数据集上也取得了令人满意的预测性能,证明了所提方法的有效性和泛化能力。
领域自适应可以解决领域偏移问题并实现跨领域RUL预测,但潜在的负迁移问题不容忽视。因此,在未来的工作中,将进一步研究如何缓解负迁移问题。同时,为了更好地优化参数,将研究预测模型的可解释性问题;为了更好地泛化到其他跨机器场景,将进一步研究基于硬件的实验验证。
推荐阅读
基于因果路径的层次图卷积注意力网络在复杂机电系统故障检测中的应用