基于深度隐变量状态空间模型的轴承退化预测

文摘   2024-07-19 08:30   北京  

Ran B. Peng Y. & Wang Y. Bearing degradation prediction based on deep latent variable state space model with differential transformation. Mechanical Systems and Signal Processing, 220, 111636 (2024).

摘要

滚动轴承是机械传动设备的核心部件,预测其退化趋势对于保障设备的安全稳定运行至关重要。目前,大多数基于状态空间模型(SSMs)的轴承退化预测方法都采用线性函数或简单的非线性函数(如指数函数、幂函数)来建立状态和测量方程。然而,这些方法无法适应实际应用中复杂多变的非线性退化过程。针对这一问题,论文开发了一种基于深度隐变量的状态空间退化模型,并将其应用于轴承退化预测。所提方法继承了状态空间模型的优点,能够以结构化的方式对不确定性进行建模。此外,通过引入微分预变换,进一步提高了模型的长期预测性能。为了验证提出模型在预测轴承退化方面的有效性,论文使用了PRONOSTIA平台的轴承数据集和真实的风力涡轮机轴承数据进行了实验。实验结果表明,论文所提方法在轴承退化预测精度方面优于现有方法,充分证明了模型的优越性能。

引言

轴承作为旋转机械的关键支撑部件,也是最容易受损的部件之一。通过准确预测轴承的退化趋势,并采取基于“状态维修”的预测性维护策略,不仅能够有效降低经济损失和资源浪费,还能显著提升设备的可靠性。
基于时间序列分析的轴承退化预测在预测性维护领域得到了广泛应用,这是因为退化数据中存在固有的时域相关性。在众多时间序列分析技术中,状态空间模型(SSMs)已经成为一种强大的结构化时间序列建模工具,这得益于它们复杂的推理方法、可解释性和概率预测能力。然而,现有用于随机运行环境中动态退化过程的状态空间模型存在灵活性、代表性不足等局限性。
近年来,基于深度学习(DL)的模型因其能够在复杂数据中挖掘隐藏的模式和法律而受到越来越多的研究关注。深度学习模型的复杂拓扑结构使它们能够有效地学习特征和识别模式,从而使它们适合于建模复杂的退化行为,例如变分自编码器(VAE)和递归神经网络(RNN)模型等。但深度学习模型的实际工程应用也面临诸多困难,为此迫切需要一种能够提供概率预测并能适应复杂退化行为的退化建模方法。为了应对这些挑战,结合SSMs和DL模型的优点,论文提出了一种带有微分变换的深度隐变量SSM,用于轴承退化预测。
论文提出的模型在SSM框架内整合了RNN模型作为状态转移方程,并引入了VAE解码器作为退化测量方程,构建了一个新的深度隐变量状态空间退化模型。该模型利用了退化速率变化比退化量变化更稳定的特性,通过微分预变换处理输入数据,提高了长期预测的性能。此外,模型还结合了深度网络的非线性映射能力和SSMs的结构化不确定性建模。在贝叶斯框架下,论文推导了模型的状态转移分布和状态发射分布,并从贝叶斯统计学的角度分析了与传统SSM的关系。最后,基于深度隐变量状态空间退化模型和蒙特卡洛方法,开发了一种新的退化和剩余使用寿命预测方法。

方法

传统状态空间退化模型

SSM是一种广泛应用于时间序列分析的工具,它为序列数据的建模提供了一种灵活而全面的方法。它不仅表示系统的内部状态,还揭示了内部状态与外部输入和输出变量之间的关系。传统的SSM包括两个方程:状态转移方程和观测方程。状态转移方程描述了系统的内部状况及其在输入变量影响下随时间的变化。它是系统变化的基本机制。观测方程输出系统在特定时间的状态,反映了系统对输入变量变化所作出的变化。SSM的状态转移方程和观测方程可以分别表示如下:
传统的SSM通常基于平稳时间序列的假设,并且只能捕捉一些线性或弱非线性关系,而不能捕捉强非线性关系。此外,它在预测中长期时间序列方面存在局限性,并且在建模复杂数据时灵活性较低。

深度隐变量状态空间退化模型

在审视经典SSM时,我们可以发现SSM的状态方程(或转移分布)是一个递归过程,而观测方程是一个生成过程。因此,转移分布可以使用递归神经网络来建模,观测方程则可以使用自编码器模型来描述,从而构建一个适用于复杂退化过程的深度隐变量SSM。
  • 基于深度生成模型的观测方程
在实际应用中,通常会使用几个可观测的测量值来表征退化程度。然而,可观测的退化通常受到不可观测的隐藏变量(如退化速率)的影响。此外,在数据生成过程中,传统的模型如ARIMA和LSTM需要手动选择合适的特征和模型参数,并且难以处理高维时间序列数据。相比之下,变分自编码器(VAE)可以学习数据的低维表示并自动提取特征,从而减少了大量的特征工程需求。此外,VAE对于包含噪声和变形的数据具有更强的鲁棒性。与传统的SSM相比,它在建模退化数据的概率方面具有优势。
因此,论文通过使用基于全连接神经网络的深度VAE建立了一个轴承退化观测模型。作为VAE的核心,潜在变量z可以包含描述轴承状况的关键特征,如退化水平或性能指标。VAE假设轴承退化数据的生成过程是由一个潜在变量控制的。为了捕捉潜在变量的有用特征,引入了一个编码器来为潜在变量生成一个变分概率分布。然后使用解码器尽可能准确地重建退化数据,从而实现预测能力。
  • 基于GRU的状态方程
由于轴承退化的程度与时间有关,一般的轴承退化趋势是随着时间增加而加剧的。因此,需要一个能够捕捉轴承退化量历史数据并将其转换为当前时刻输出的状态转移模型。由于SSM的状态方程框架与深度学习领域中RNNs的框架相似,自然地考虑用RNNs替换了SSM中的状态转移方程。在各种RNN模型中,GRU是一种特殊的RNN,它通过引入门控机制来控制信息流,从而有效地缓解了梯度消失和爆炸的问题,并提高了模型的泛化能力。因此,论文使用GRU来分析退化数据中的时间序列关系,建立轴承退化率的状态转移模型,并拟合状态转移方程中的参数。
图1 隐变量状态空间基本思路
如图1所示,引入了中间变量来表示在时间t的退化率z的所有过去时间段的的相关信息。状态随时间演变,并通过在每个时间步使用状态更新方程从序列的前一个元素中融入信息。
  • 总体框架
为了解决轴承退化数据的复杂分布问题,我们建立了一个深度隐变量SSM,该模型利用了VAE和RNN的优点,如图2所示。这个模型包含了一个高度灵活的架构,适合于建模广泛复杂的数据分布,从而实现轴承退化数据的准确预测。此外,由于轴承退化过程的非线性以及测量设备和传感器的局限性,测量参数(如轴承振动和温度)时可能会出现误差,导致退化数据中噪声过多,降低了剩余使用寿命(RUL)预测结果的可信度。为了提高轴承寿命预测的准确性,我们通过对退化量进行微分预变换来获得退化率,利用退化率相对于退化量的稳定性。
图2 所提方法的概率图模型

实验

基于微分变换的深度隐变量状态空间模型的构建

所提出的模型通过三个神经网络层实现:状态转移层、编码器层和解码器层。状态转移层使用GRU来捕捉历史数据特征。编码器和解码器层主要用于数据压缩和重建。遵循Barron的“通用近似理论”和VAE建模中的常见方法,我们选择了高度灵活且参数丰富的全连接神经网络,并搭配激活函数,有效地构成了模型的编码器和解码器。为此,选择了ReLU作为激活函数,因为它具有非线性特性、计算速度快以及减轻梯度消失问题。提出模型的具体构建细节图3中详细说明。
图3 构建模型细节

对比实验一

在本节中,论文使用从PHM 2012预测挑战赛中获得的数据来验证所提出方法的有效性。由法国贝桑松的FEMTO-ST研究所提供的PHM2012数据集被用来估计轴承的剩余使用寿命(RUL)。该数据集是使用一个名为PRONOSTIA的实验平台构建的,该平台旨在测试和验证轴承故障检测、诊断和预测方法,如图4所示。
图4 PRONOSTIA实验平台
此外,为了更好地展示所提出模型在预测轴承退化趋势方面的有效性,文中将其与来自不同领域的三个模型进行了比较。第一个模型是经典的深度学习神经网络LSTM,它被认为是深度学习领域的高度代表性模型,在处理序列数据方面表现出色。第二个模型是最先进的统计方法,称为切换状态空间模型(Switching SSM),它使用Rao-Blackwellized粒子滤波器(RBPF)来估计噪声矩阵并动态跟踪退化轨迹。第三个模型Deepstate将传统的状态空间建模与深度学习技术相结合,使用递归神经网络将特征映射到状态空间模型的参数上,然后使用卡尔曼滤波来预测每个时间步序列值的概率分布。
选择了14个指标,如RMS值(反映信号能量)、峰度(反映影响程度)以及波形因子和峰值因子等非维度指标来评估轴承的健康状况。随后,使用马氏距离方法来融合这14个指标,并进一步对融合数据进行平滑处理,以获得清晰的健康指标。
比较结果如图5所示。在图5中,蓝色曲线是原始轴承退化数据曲线,红色曲线是使用所提出模型预测原始轴承退化数据后的40%预测曲线,黑色曲线是使用LSTM模型得到的预测结果,绿色曲线是使用Deepstate模型得到的预测结果,紫色曲线是使用切换SSM得到的预测结果,阴影棕色部分表示所提出模型的95%置信区间。图(c)和(d)展示了当轴承1_1和轴承1_3的退化数据预测阈值设置为0.8时,所提出模型得到的预测值的概率分布。
图5 对比实验一结果

对比实验二

为了验证所提出方法的全局性和鲁棒性,文中还使用了2021年提取的三个真实的风力涡轮机轴承退化数据集进行验证。为了获得实际轴承的退化信息,在发电机轴承的内圈、外圈、滚动元件和保持架上安装了状态监测系统(CMS),如图6所示。
图6 风力涡轮机状态监测系统
同样地,使用马氏距离方法来融合这些14个指标,并对数据进行平滑处理以获得轴承健康指标。经过标准化后,获得了三个风力涡轮机轴承的退化数据,如图7所示。所提出的模型被用来预测这些数据的最后40%,并与调整超参数后的LSTM、Deepstate和切换SSM的优化预测进行了比较,比较结果如图8所示。
图7 三个风力涡轮机轴承的健康指标
在图8中,蓝色曲线是原始轴承退化数据曲线,红色曲线是使用所提出模型预测原始轴承退化数据后的40%预测曲线,黑色曲线是使用LSTM模型的预测结果,绿色曲线是使用Deepstate模型的预测结果,紫色曲线是使用切换SSM的预测结果,阴影棕色部分表示所提出模型的95%置信区间。右图显示了当设置预测阈值为0.8时,所提出方法预测值的概率分布。
图8 对比实验二结果
根据实验结果,显然LSTM模型的预测精度始终低于所提出的模型。Deepstate在某些时间点表现出相当大的偏差,并且在预测复杂趋势数据时显示出较低的稳定性。切换SSM模型在某些方面显示出稳定性,但与所提出的模型相比,在准确性方面有所不足。总的来说,所提出的模型在预测精度方面比三个比较模型提高了至少20%。与实验1中相对简单的退化趋势相比,所提出的模型在处理复杂退化趋势时显著提高了其性能。这进一步突出了模型更好地处理非线性关系和长期依赖的能力,从而提高了预测精度。

结论

由于轴承退化数据具有高度非线性和复杂的随机分布,建立一个能够准确学习和预测退化趋势的模型是一项具有挑战性的任务。为了解决这个问题,本文提出了一种基于微分变换的深度隐变量SSM,用于轴承退化预测。所提出的模型在SSM框架内结合了RNN模型作为状态转移方程和VAE解码器作为测量方程。这种方法解决了现有SSM的局限性,这些模型在复杂环境中难以适应动态非线性退化过程。此外,所提出的模型利用了退化率的变化比退化量的变化更稳定的特点,并应用了微分预变换来缓解长期预测中的不稳定性问题。
为了验证所提出方法的有效性,论文使用了PHM2012轴承数据集和真实世界的轴承退化数据,将所提出模型的预测性能与LSTM、Deepstate和切换状态空间模型的预测性能进行了比较。结果显示,与现有方法相比,所提出的模型提高了PHM2012加速退化数据的预测精度至少10%,并提高了实际风扇轴承退化预测精度至少20%,从而证明了所提出模型在处理复杂非线性数据方面的优势。所提出的模型将深度学习方法整合到结构化建模中,具有在学习隐变量和动态建模时间序列数据方面的解释潜力。未来的探索可能涉及各种方法来增强所提出模型的可解释性。例如,将因果推断和分析技术结合起来,更深入地研究隐变量之间的因果关系及其与输入和输出的联系。另一个途径可能是利用领域专业知识来解释模型生成的隐变量。

推荐阅读:
一种全新滚动轴承局部缺陷扩展动态更新和实时映射的数字孪生模型
面向滚动轴承故障智能诊断的数字双驱动局部域自适应网络
无寿命标签下的RUL概率预测:一种融合贝叶斯深度学习和随机过程的方法
CBAM增强残差卷积域自适应网络在跨机滚动轴承剩余使用寿命预测中的应用
考虑量化的随机退化设备的剩余寿命预测
锂电池多物理场-退化耦合模型的参数灵敏度分析
基于因果路径的层次图卷积注意力网络在复杂机电系统故障检测中的应用
考虑大规模电池储能热致事故的可再生能源系统可靠性评估
用于预测和健康管理的类ChatGPT大型基础模型:综述和路线图
基于动态贝叶斯网络和数字孪生的水下控制模块可靠性分析

学术人人
传播科学与学术研究动态,发布学术领域重要研究成果。 重点推广可靠性系统工程(包括可靠性、维修性、保障性、测试性、安全性和环境适应性)理论研究成果,传播相关知识。
 最新文章