摘 要
针对三相异步电机匝间短路故障在不同工况下数据分布不一致带来的泛化识别准确率下降的问题,提出了一种基于残差-自注意力网络的迁移学习方法,通过在残差网络中嵌入自注意力机制实现特征强化并利用源域数据进行模型训练,然后利用迁移学习的微调策略使得模型能更好地适应目标域的特征分布,以此来增加模型在目标域数据中的适应性能力。
此外,通过设计对比实验探究了引入微调训练以及在模型中嵌入自注意力机制对于模型诊断性能的影响。
实验结果表明,所提方法在3种负载条件下迁移的平均准确率为87.5%,相较于一般的残差网络准确率提高了4.5%,同时召回率和 F1分数分别提高了约10%和6%。
0 引 言
三相异步交流电机是工业领域中广泛应用的电气设备,其运行状态直接影响生产效率和系统稳定性。因此, 对三相异步交流电机进行有效的故障诊断是非常重要的。匝间短路故障是三相电机中最常见的故障之一,它会导致 电机效率降低、温升增加、噪声增大等不良后果。
目前,针对匝间短路故障的诊断方法主要分为基于机理分析的方法、基于信号特征分析的方法和基于数据驱动与人工智能的方法。
基于机理分析的方法:通过建立电机数学模型,利用仿真模型及电流波形来判断匝间短路故障。这类方法可以实现较高的诊断准确率,但需要准确掌握电机参数。
基于信号特征分析的方法:通过提取电机运行时监测信号中的特征参数(如频谱、包络、模态分量等),并根据特征参数与匝间短路故障之间的关系来判断故障。这类方法具有一定的适用性和准确性,但需要选择合适的信号类型和特征参数。
基于数据驱动与人工智能的方法:通过利用大量已知故障类型和程度的数据来训练机器学习模型,如模糊逻辑、遗传算法、贝叶斯分类器、神经网络等,然后利用训练好的模型来对未知数据进行故障诊断。这类方法相较于前两类方法具有更好的泛化性能, 但需要大量且高质量的数据,并且对模型结构和参数有较高的要求。同时基于数据驱动的方法通常会从大量数据中进行特征提取,因此为了提高不同传感器得到的数据效力,会采用数据融合方法强化数据特征,再利用深度学习进行特征学习从而实现故障诊断。但是以上方法在变工况数据条件下,诊断准确率会大幅降低。
迁移学习通过在已有数据域中获得的数据分布,结合新数据域中的数据分布,从而提升模型在新数据域中的分类性能。对于工况变化,如果目标域存在标签,则可以通过数据的训练和微调,固定网络高维特征提取及分类层实现模型迁移,使模型适应目标领域的特征分布, 从而有效提高模型在不同工况下的准确率。如果目标域数据缺失或者标签不足,则可以采用仿真源域数据,或者目标域数据使用伪标签的方式进行处理。因此通过微调训练的方式可以有效提高深度学习模型在面对变工况问题时的诊断准确率。
本文提出了一种基于残差-自注意力网络(residual self-attention,Res-SA)的迁移学习模型,用于解决变工况条件下模型泛化能力不足导致诊断准确率低的问题。
该方法将自注意力机制嵌入到残差神经网络中,可以更好地捕捉不同层级的特征依赖关系,促进不同层次特征之间的信息传递。同时,该方法利用迁移学习技术,可以有效地利用已有的数据和知识,提高模型的泛化能力和诊断准确率。
1 方法介绍
1.1 残差神经网络(ResNet)
残差神经网络是一种深度学习架构,旨在解决深层神经网络训练过程中的梯度消失和训练困难问题。通 过引入"残差块"(residualblock),其中每个残差块包含了跳跃连接,允许网络在学习过程中保留之前层的信息。
残差块结构如图1所示:
其中每块卷积网络都由一层卷积层和一层批标准化(batchnormalization,BN)组成,其中,卷积层用于提取输入数据的特征,BN 层在卷积层后调整特 征映射的分布,提高梯度流动,加速训练并增强模型的泛化能力。
对于网络输入x 以及目标输出H(x),残差连接通过 引入残差函数F(x)= H(x)-x,不直接训练网络学习 从输入到输出的映射,而是学习残差函数 F(x),并且通 过残差连接使得网络输出变为 H(x)=F(x)+x。此连 接方式允许网络在学习的同时,保留了原始输入x 的信息。如果 H(x)和x 的差别不大,那么网络只需要学习一 个较小的残差函数F(x)。这可以更容易地优化,因为残 差函数相对来说很小,梯度传播更加稳定,从而有效解决 梯度消失和梯度爆炸的问题。
1.2 自注意力机制
自注意力机制,也称为注意力机制,用于处理序列数据(如语句、图像中的区域)中不同位置或元素之间的关系,并赋予这些关系不同的权重,以便更好地捕捉上下文信息。
自注意力模块结构如图2所示:
在自注意力机制中,输入序列中的每个元素都可以看作是查询(query)、键(key)和值(value)的线性变换。
计算公式为:
由此通过计算查询与键之间的相似度,然后将相似度 作为权重应用于值,最终生成加权求和的结果,这个过程就是注意力机制的核心。注意力权重决定了每个位置或元素对于当前位置或元素的重要性,从而使得模型能够在不同位置之间建立关联。
1.3 Res-SA迁移神经网络
尽管卷积操作可以捕捉数据特征,但它难以建立数据 上下文特征的相关性,因此对于周期性特征和前后关联性特征的敏感性较低。
本文将自注意力机制嵌入到残差块之间,通过计算不同层级之间的特征关联信息,实现对不同层级特征依赖关系的捕捉,进而促进不同层次特征之间的信息传递。这样的设计能够在更全局的层面上进行特征整合,从而提高模型对于不同工况数据下的特征获取能力。
网络模型整体结构如图3所示:
模型的总体架构分为3个主要部分。
1)模型的输入部分:
输入数据通过卷积运算后获取得到数据中的初级特征。
2)网络的核心结构:
该部分涵盖了4个残差层,每个残差层均包含两个残差块。残差块旨在实现捕获特征中的非线性关系,将初级特征强化聚焦得到高级特征,更为准确地表征故障数据。同时,在每个残差层之前加入的自 注意力层,旨在对残差层输出的特征进行关联强化,有助 于模型更好地理解和利用不同位置上的特征。
3)输出处理:
在对特征进行池化操作后,将所得特征通过全连接层 进行分类处理,将提取的特征映射到具体的故障诊断类 别,从而获得最终的诊断结果。
本文首先利用源域数据对模型进行初步训练,使其具备通用特征提取能力。在此基础上,将模型的除最后一层全连接层外的网络参数冻结,以保留已学到的通用特征。随后引入目标域数据,通过输入目标域数据对网络再训练 微调模型,使模型更好地适应目标域的特征,实现了从源 域到目标域的迁移学习。
2 实验设置与结果分析
2.1 数据采集与预处理
本文使用的数据来源于电机故障仿真实验台,实验台实物如图 4 所 示:
实验所用电机型号为YE3-112 M-6- 2.2,匝间短路故障通过在电机定子 U 相上抽出不同匝数 的接头实现不同程度的短路,同时在短路匝上串接保护电阻,防止断流电流过大烧毁电机定子,电阻阻值设置方式为在电机安全前提下,调节保护电阻阻值使得匝间短路电流尽可能接近电机定子额定电流,接线方式如图5所示:
电机通过变频器进行控制;磁粉制动器 PB-5作为电机负 载用于模拟电机不同负载下的工况。电机上安装有水平 方向和竖直方向的振动传感器,用于采集电机两轴振动数 据以进行故障诊断,振动传感器型号为603c01,实验使用 NI9234采集卡配合 Labview 程序进行采集。
实验通过设置变频器输出频率和磁粉制动器扭矩,以获取在不同转速下的负载变化情况。变频器频率分别设置为10、30和50Hz,分别对应不同的转速情况。负载设置为从0~20N·m,每5N·m设置一个负载档位。通过选择相匹配的负载和转速,在避免电机堵转的同时满足相应的负载需求,得到电机的3种不同工况条件,分别为空载、低负载和高负载分别标记为D1、D2、D3,具体设置如表1所示:
同时为了使得模型能适应不同故障程度的特征,实 验设置了从1~26匝不等的,共计5种短路程度,以表示不同的故障程度,保证每种工况下包含5种不同的故障程度数据。
实验设置总计有9组工况和5种故障程度,包含无故 障的实验总共进行54组实验,每组实验采集了60s振动 信号,采样率为5000Hz。将 原始故障数据通过长度0.5s、步长为0.04s的滑窗制作为一个片段,每个片段作为一个样本由两路振动信号组成。然后通过相同长度的 滑窗获取与故障样本数量相匹配的正常样本,并对数据集 进行样本平衡操作,最终得到数据集中包含正常样本和故障样本约10000条。所采集到的正常样本下振动信号以及匝间短路故障样本的振动信号,如图6所示:
2.2 实验结果对比分析
本文首先利用源域数据对模型进行初步训练,使其具 备通用特征提取能力。在此基础上,将模型最后一层全连接层外的网络参数冻结,以保留已学到的通用特征。随后引入目标域数据,通过输入目标域数据对网络再训练微调 模型,使模型更好地适应目特征的提取能力,而目标域数 据的微调使模型能够更好地适应目标领域的特征分布,从 而在目标任务上取得更好的性能。
这种方法充分利用了已有知识,减少了在目标域上大量重新训练的需要,提高了模型的效率和泛化能力。实验所用模型基于 Pytorch 进行搭建,训练优化器选用Adam优化器,学习率设置为 0.0001。
模型评价指标的选择是模型性能评估的重要因素。实验中选择准确率、召回率和F1分数作为评价指标,其中准确率指模型对于样本诊断正确的比例,准确率虽然是一个模型整体的性能度量方式,但其无法反映模型全部性 能;而召回率则用于评价模型对于故障的漏报率,高召回 率可能伴随着低准确率,导致模型更容易产生误报;F1 分 数则综合考虑准确率和召回率的指标,能够综合反映模型准确率和召回率间的平衡。
3种评价指标的计算方式如下:
为了验证所提方法的有效性,本文首先利用源域数据训练 Res-SA 模型,不经过微调直接用于目标域数据的诊断,6组迁移实验所得的实验结果如图 7所示:
准确率均在50%附近,而召回率则全部为100%,由此可知不经过 微调迁移的模型无法正确分类由模型得出的高级特征,因 而将全部正常样本错分为了故障样本。
然后将在源域经过训练的 ResNet模型和 Res-SA 模 型利用目标域数据进行微调迁移,得到的准确率、召回率 和F1 分数如表2所示:
可以看出,Res-SA 网络在不同迁移任务中的诊断准确率整体高于 ResNet网络,且 Res-SA网络准确率相较于 ResNet提升了约4.5%,同时 Res-SA召回率提升了约10%、F1分数提升了约6%,说明 ResSA模型能够实现更全面且更准确的诊断,体现了所提模型在处理三相电机匝间短路故障诊断问题上的优越性。
3 结 论
本文提出了一种Res-SA 网络的迁移学习方法,该方法将自注意力机制嵌入到残差神经网络中,利用迁移学习技术,可以有效地利用已有的数据和知识,增强模型在目标域上的泛化能力,提高变工况下故障诊断的准确率。
通过使用不同工况下的三相电机振动数据进行对比实验,验 证了所提方法在变工况条件下针对匝间短路故障诊断的有效性。
实验结果表明,所提方法在不同工况下的诊断准 确率以及准确率均值整体高于对比方法,说明了所提出方法的有效性。
综上所述,本文所提方法可以适应不同工况下的数据分布,具有较强的泛化性,同时可以进一步研究空载工况下数据分布与带负载工况下数据分布的差异,从而提高模型在目标域为空载工况下的诊断准确率。
—THE END—
参考文献:
李剑君, 李昂, 王勇飞, 等. 变工况条件下三相异步电机匝间短路故障诊断[J]. 国外电子测量技术, 2024, 43(3): 162-167.
感谢对本公众号的支持,点个“在看”收藏一下吧~
如需购买视频课程资源,请联系:forwardtszs