摘要
对于复杂旋转机械关键部件的诊断任务,模型设计容易受限于以下两个特点:
① 机理驱动的方法往往难以实现复杂系统的完备、精准建模; ② 数据驱动方法多数需要规模化的高质量训练数据集用于训练。
针对上述问题,提出一种先验知识嵌入的深度学习模型,融合机理知识与传感器信号特征。并通过引入轻量化模型结构,在保证模型精准性的前提下降低推理延迟。
首先,通过融合先验机理知识与传感器信号特征,构建关键部件数字孪生体。 然后,设计先验知识嵌入模块来提升深度学习模型对融合特征的表征能力。 最后,基于帕累托最优化理论,设计考虑准确性指标和计算效率指标的多目标优化方法,对基于深度学习的诊断模型进行结构优化设计,并引入可解释性框架对深度学习模型决策过程进行分析。
结果表明,所设计的关键部件数字孪生体能够提供丰富的先验信息从而加速模型收敛。基于帕累托最优化理论的训练策略,能够搜索到设定指标的相对最优解,从而在保证模型精准性的前提下有效降低模型推理延迟。
0 前言
对于某些特殊工业产品等过程的诊断任务而言,常常难以获得大量各退化阶段的有标签数据,从而构造标准化数据集。这导致纯粹的数据驱动模型在这些应用中的泛化性能、鲁棒性等方面受到一定限制。此外,纯数据驱动的深度学习方法在模型内部推理机制等方面不明确,类似“黑箱模型”的运行机制限制了其在产业界的推广应用。
在此背景下,可信和可解释的人工智能(Artificial intelligence, AI)相关概念应运而生。其主要体现在模型特征知识学习过程的可解释性、先验知识嵌入以及模型推断过程的不确定性量化等方面。
数控类机械装备的状态监测与诊断 方法尽管在近年来已取得显著进展,但在模型可解释性、机理与数据特征融合程度等方面仍然有待进一步探索。
本文提出一种先验知识嵌入的可解释性智能诊断方法,通过构建的数字孪生体实现对先验知识的嵌入,并构建事后可解释性方法分析智能模型的决策过程。
1 提出的智能化诊断方法
本文以加工制造场景下的刀具状态和性能监测为主要应用目标,提出了一种基于先验知识嵌入的 智能化方法。
方法主要包括两个部分:
① 基于非完备信息的数字孪生体构建; ② 先验知识嵌入与特征提取。
总体框架如图 1 所示:
其中,数字孪生体首先实现机理与数据的信息融合,然后,通过深度学习模型特征提取,充分挖掘和表征这些融合后的特征知识。
1.1 基于非完备信息的数字孪生体构建
所提出的数字孪生体,以切削加工纹理的形貌分析为先验知识,融合传感器信号与工艺参数信息。
数字孪生模块的输出为生成的复合纹理数据。
复合纹理数据是一种内嵌切削加工参数知识与观测值(包括:主轴窜动、磨损量)的复合式数据,通过深度学习模型的迭代训练,产生的决策结果输入到事后可解释性分析模块进行分析。此处,复合纹理 数据集可为单一来源形式,或与白光干涉仪采集的 纹理数据混合组成新数据集。本研究通过案例 1 和 案例 2 分析了上述两种情形的效果。
构建的数字孪生体模型主要包括三个主要步骤:
① 孪生模型初始化; ② 扫略路径建模; ③ 数字孪生体的参数更新。
第一步为孪生模型的参数初始化。通过网格精 度约束设置切削参数,保证切削刃微元在单位时间 步长最多扫过一个工件网格点
第二步扫略路径建模主要通过一系列的局部坐 标系变换获取主轴转动、进给等运动组合影响下的扫略路径。对于刀齿局部坐标系下的离散切削点可被描述为如下形式:
对于整体式铣削刀具,设螺旋角为s,其切削刃离散点可被表示为:
对于矩形循环进给,其在刀具局部坐标系下的运动形式可被表示为:
其他形式的进给运动同样具有相应的参数化形式,此处不做赘述。
第三步是基于可观测信息的数字孪生体参数更新。对于切削加工状态监测任务,考虑到复杂数控 装备的状态影响因素较多,可观测信息可分为半可 观测和完全可观测信息,提出的数字孪生体综合利 用半可观测信息和完全可观测信息,实现孪生体参数更新。
其中,机床夹具和主轴等关键振源位置处的振动信号被广泛用于切削加工过程监测,可采集 连续加工过程的振动信号,因而属于完全可观测信息。考虑到切削加工过程的主轴瞬时窜动信号受到 切屑和切削液飞溅、工作空间干涉等问题较难安装 激光测振等传感器实现准确监测,此处采用数值积分方法对瞬时切削振动特性进行描述
刀具等关键部件的磨损退化信息由于生产制造 管控,常难以通过频繁的离线机器视觉测试检查并 记录部件状态信息。只具备少量切削试验获取的历 史退化信息可被视为半可观测信息。而随机退化模 型是一种经典退化分析方法,能够基于少量数据实现退化过程分析。在此基础上发展的数模联动方法对于具有半可观测数据的情形较为适用。
因此,采用历史加工刀具退化信息构建随机退化模型实现 数字孪生体的参数更新是一种潜在手段。对于刀具状态监测任务,半可观测指当前被测刀具的磨损信息无法获取,只能利用历史刀具退化信息。为实现对历史磨损退化趋势的参数估计,许多参数优化方 法可被采用。本文采用非线性最小二乘法和网格搜索实现拟合,然后将模型用于刀具磨损量修正。
1.2 先验知识嵌入与特征提取
设计的先验知识嵌入模块是用于提升加工参数 嵌入下的跨工况刀具综合切削性能识别(包括磨损量、粗糙度)性能。
具体结构和关系如下:
为了充分表征工艺参数与刀具状态的耦合影响,在第 1.1 节所述的数字孪生体构建方面,提出方法以参数化切削纹理形貌为基准模型,将切削窜动和磨损导致的刀具运动叠加和直径变化作为待更新参数,生成复合纹理数据。
生成的复合纹理数据输入到第 1.2 节的先验知识嵌入与特征提取模块实现对纹理数据的特征提取。网络优化目标为不同工况下的切削性能辨识,其通过多分类交叉熵函数实现。提出的物理信息嵌入的特征提取模块主要包括4 层结构。
如图 2 所示为知识嵌入与特征提取框架。
2 监测诊断模型的案例验证
高性能数控切削加工装备的状态监测对于保障 高端制造的生产效率具有重要意义。
本文以铣削加工刀具为研究对象,通过刀具磨损监测和刀具性能 退化监测两个案例对提出方法进行了验证。
为验证提出方法的有效性,从以下三个方面对试验结果进行分析:
① 以模型收敛速度和准确率为指标,对比本文方法与其他深度学习类故障诊断方法; ② 开展消融试验,验证知识嵌入模型在故障诊断方法中的必要性; ③ 以计算效率和精准率为指标,对比提出方法与其他面向移动端的深度学习模型。
2.1 切削加工监测诊断数据集
采用的加工监测公开数据集从立铣刀具磨 损退化监测试验获取,其试验环境如下:机床型号为 DMU 80p duoBlock,振动传感器型号为 PCBW356B,考虑到数字孪生建模对转速等信息的依 赖,而部分工况下某些切削参数的变化过程未给出精确信息(如:主轴转速)。
因此,共选取该数据集8组数据,其不同阶段信号如图 3 所示:
表 1 描述了数据集 1 的数据标签(状态 A1、A2)、状态和工况等 信息:
对于刀具磨损标签划分,ISO8688-2 规定的 后刀面失效量为 0.3 mm。本文基于此设定一定提前 量为其预警边界,并取提前量为 3 次观测。
如图 3 所示为数据集在不同状态下的振动信号可视化结果,其中 W1、W5 和 W8 分别表示工况 1、5、8 几种不同切削条件下的监测信号。
2.2 模型收敛速度和准确率对比分析
表 2 为推理模型在测试集上的平均值和标准差:
为避免数据划分导致的差异性,试验随机划分训练集和测试集,并统计了三种模型在这些划分后 数据上的收敛特性。
本文方法的特征提取基础模型结构详见第 1.2 节所述。
主要参数设置如下:深度可分离卷积和标 准卷积的结构比率系数为经验性取值,取值范围为 [0.2, 0.3, 0.4]。
为验证本文方法在收敛速度和准确率上的优势,选取了两种基于深度学习的故障诊断方法开展对比研究。
各模型结构参数如下:
① 模型 1:全标准卷积模型;
② 模型 2:全轻量级卷积模型MobileNetv2;
③ 本文模型。提出模型的训练主要包括两个阶段:
第 1 阶段通过数字孪生模型实现切削先验信息嵌入; 第 2 阶段通过帕累托最优化方法,以准确率和推理延迟(计算效率)为优化目标,对深度学习模型的超参数和尺度缩放结构参数进一步微调。
如图 4 所示为三种模型在第 2 阶段的收敛速度比较。
尺度缩放结构参数主要控制模型的大小,范围 为[0.8, 0.9, 1.0]。其中,橘色短线、粉色三角形和棕 色×符号分别表示搜索过程的中位值、离群值和平均 值。相比于模型 1、2,本文模型在训练过程综合权 衡了精准性指标和推理延迟。
其相比于模型 1 训练 中后期的离群值较少,相比于模型 2 在训练末期收 敛过程振荡较小(间接体现其收敛效果),精准性有小幅提升。
2.3 消融试验结果分析
提出方法在标准深度卷积神经网络模型基础上改进形成,针对切削加工监测任务从以下几个方面进行了改进:
① 先验知识嵌入:将切削加工参数嵌 入复合纹理数据; ② 轻量级卷积结构:引入深度可 分离卷积结构降低模型延迟; ③ 多阶统计特征提 取:引入全局协方差池化提取切削纹理的多阶统计 信息。
因此,开展如表 3 描述的消融试验:
通过对 5 种模型采用的方法和本文方法的对比,验证提出结构的有效性。消融试验的准确率和推理时间等结果详见表4:
2.4 基于 Shapley 值的模型可解释性分析
通过消融试验可知,设计的智能模型在引入先 验知识嵌入后,其精准性得到验证,然而,现有的深度学习模型的内在可解释性不强,完全的“白盒 模型”仅支持对决策树类等较低复杂度的机器学习 算法改造。本研究通过 Deep SHAP 框架,分析智 能诊断模型的事后可解释性,并计算了 Shapley 值 可视化模型的决策过程。
如图 5 所示为对不同磨损 状态的数据可视化结果,可视化结果展示了像素层 面不同磨损状态(正常磨损、剧烈磨损)下不同样本 的决策过程差异性。其中,红色和蓝色分别表示正 面和负面贡献度的强弱(即模型对类别判定过程):
2.5 刀具性能退化监测与评估试验
如图 6 所示为刀具性能退化评估试验的试验台 布置与流程设计。该试验采集了不同刀具磨损状态 下的振动信号,数据采集仪(DAQ)系统型号为奇高 USB-4288。并获取了锋利和剧烈磨损两种状态下的 工件表面粗糙度微观纹理图像数据。微观纹理图像 数据通过清华大学摩擦学重点实验室的开放设备 (白光干涉仪 ZYGO NEXVIEW)测试获得。刀具的 磨损情况根据标准 ISO-8688-2 的磨损参考阈值判定。刀具磨损通过刃型定位与磨损区提取实现。
该试验设计的监测算法框架如图 7 所示。智能 模型的输入数据包括两个部分:
① 基于切削参数、主轴振动信号以及刀具刃线修正模型的纹理分析方法获取的纹理数据; ② 实际采集的工件纹理微观图像数据。通过数据和知识的融合,充分挖掘现场传感器数据信息,同时利用运动学、纹理分析等机理知识提升识别与诊断模型的精准性。
如表 5 所示为刀具性能退化监测与评估试验的 数据划分情况:
基于待测零件的技术要求,3 种工 况下数据汇总后被划分为两种粗糙度类别(达标和 未达标),状态 B1、B2 表示训练数据的标签设定。
如表 6 所示为刀具性能退化评估试验的统计结果:
其中,单数据源指模型数据仅来源于实测微观纹理。通过在不同工况下的试验测试,验证了提出 算法框架对粗糙度指标 Sa 识别的精准性优势。
3 结论
本文提出了一种基于先验知识嵌入的轻量级可 解释性智能诊断方法,通过切削加工过程的刀具磨 损监测和刀具退化性能评估两个案例验证了提出方法的精准性。
基于测试试验,本文得出以下结论,总结如下:
(1) 基于相关先验知识嵌入,能够提升模型在 监测数据量不足情形下的模型收敛效果和精准性。案例 1 和案例 2 在模型设计上同为先验知识嵌入的 诊断方法;但在数据输入上,分别验证了数字孪生 模型为唯一数据来源和复合数据来源时的模型效果(详见图 1 和图 7)。 (2) 通过轻量级卷积与全局协方差池化等结 构,构建了基于多阶统计信息的特征提取模型,在表征纹理多阶统计特性的同时实现了较低的计算 延迟。 (3) 通过沙普利值(Shapley 值)的加性可解释深 度学习框架实现了智能诊断模型的事后可解释性分析。方法通过决策过程的可视化分析,探究了不同刀具磨损状态下的特征差异性。
—THE END—
参考文献:
刘岳开,王天杨,褚福磊.基于低延迟可解释性深度学习的复杂旋转机械关键部件知识嵌入与诊断方法研究[J/OL].机械工程学报,1-9[2024-07-09].http://kns.cnki.net/kcms/detail/11.2187.TH.20240516.1111.006.html.
感谢对本公众号的支持,点个“在看”收藏一下吧~
如需购买视频课程资源,请联系:forwardtszs