点击蓝字 关注我们↑↑↑
DIGITAL TWIN
如果您不希望错过文章,就加个星标吧!
本期阅读
文章信息
论文《Roughness prediction of end milling surface for behavior mapping of digital twined machine tools》于2023年4月底收录于《Digital Twin》期刊,由西安交通大学的尚岁燕,姜歌东,孙铮等人共同完成。论文提出了一个用于表面粗糙度预测的虚拟量测量模型,该模型是一种三层反向传播神经网络模型,通过该模型实验得出:以多种信号作为输入的模型比以单一信号作为输入的模型表现得更好。
DOI: https://doi.org/10.12688/digitaltwin.17819.1
引用本文:
Shang S, Jiang G, Sun Z et al. Roughness prediction of end milling surface for behavior mapping of digital twined machine tools [version 1; peer review: awaiting peer review]. Digital Twin 2023, 3:4 (https://doi.org/10.12688/digitaltwin.17819.1)
文章阅读
Roughness prediction of end milling surface for behavior mapping of digital twined machine tools
尚岁燕1, 2,姜歌东1,孙铮1,田文文1,张大伟1,徐俊1,张志辉2
1 制造系统工程国家重点实验室,西安交通大学,西安,710049,中国
2 超精加工技术国家重点实验室,工业系统工程系,香港理工大学,香港,中国
摘要
背景:加工零件的质量被认为是评价机床生产性能的一个相关因素。表面粗糙度影响到产品的机械能力和美学性能,为了将在数字孪生的机床反映出生产性能,本文提出了一个用于表面粗糙度预测的虚拟量测模型。
方法:所提出的模型是三层反向传播神经,网络的输入是在端铣加工过程中收集的实时振动、力和电流传感器数据。使用网格搜索来确定反向传播神经网络中间层的神经元的数量。
结果:实验结果表明,以多种信号作为输入的模型比以单一信号作为输入的模型表现得更好。详细来说,当模型输入为力、振动和电流传感器数据的组合时,预测精度达到最佳,平均绝对百分比误差为1.01%。
关键词
数字孪生,虚拟量测,端铣,表面粗糙度预测,反向传播神经网络
1、引言
结合数字孪生、人工智能、云/边缘计算等新信息技术的发展,传统制造业正在向智能制造转型。机床的数字孪生映射模型旨在通过连接数据在虚拟空间中镜像出物理设备。一个数字孪生系统,包括几何、物理、行为和规则模型,从三个方面描述真实的机床,即机床是什么,机床在做什么/怎么做,以及机床的状态如何变化。加工件的质量被认为是评价机床生产性能的一个相关因素。为保证过程的稳定性和提高成品率,对每个工件的质量检测是必要的,然而,考虑到逐个工件实际测量的时间和资源成本问题,实际测量每个工件的质量是不可行的。虚拟量测量是基于制造过程中收集的传感器数据,用机器学习的方法来预测产品质量。这被认为是数字孪生系统的行为映射。有了有效的数字孪生模型,产品质量可以满足全面的自动检测的需求,并且数字孪生可以更充分地描述真实机器的性能状况。
作为衡量加工件质量的一个重要技术参数,表面粗糙度会影响机械性能,如疲劳行为、磨损、腐蚀、润滑和导电性能。理论模型是在没有实际测量的情况下了解表面粗糙度的一种直观方式。Chen等人提出了一个分段式表面粗糙度的理论分析模型来预测表面粗糙度。Taufik等人研究了一种基于理论和经验方法相结合的熔融沉积建模中模拟表面粗糙度轮廓的新方法。在这些理论和经验方法中,响应面方法(RSM)是一种符号化的方法。它可以描述切削参数(切削深度、进给率、主轴转速等)和表面粗糙度之间可推导的函数关系。Hong等人用响应面方法建立了切削速度、进给量、切削深度和表面粗糙度的二次函数。Yang等人用响应面法建立了精车钛合金时切削参数与表面粗糙度之间的数学模型。
与理论和经验模型不同,基于虚拟量测的粗糙度预测采用机器学习方法。除切削参数外,在基于虚拟量测的模型中,采用信号作为模型输入,提供加工过程中的实时信息。He等人调查了无数种用于硬车加工过程的表面粗糙度预测方法。尤其是多元线性回归模型和反向传播神经网络模型是最常使用的两种模型。Tian等人将2型模糊神经网络应用于电线放电车削加工,用于预测表面粗糙度。预测模型是由基于梯度的优化算法训练的。Singh等人通过回归树集合方法评估重要特征,然后通过迭代反向消除方法删除不相关的特征,并通过支持性向量回归估计表面粗糙度。Zhang等人提出用高斯过程回归法对端面铣的表面粗糙度进行建模。切削参数被认为是模型输入。结果显示,切削深度对表面粗糙度的影响最大,预测精度约为84.3%。Tian等人使用切削深度、切削速度和进给率作为输入变量,通过前馈神经网络预测了车削零件的表面粗糙度。大多数机器学习方法需要很长的学习时间。极限学习机具有学习速度快、泛化性能好的优点。Ahmad等人介绍了一种极端学习机方法,用于对车削操作中的表面粗糙度进行建模。它在几秒钟内具有非常快的预测反应,而且预测误差小。此外,卷积神经网络已经成为虚拟机预测模型的一个新趋势。它的自动特征提取能力可以提高预测精度,而不是使用手动提取的特征。
虽然有多种机器学习方法用于表面粗糙度预测,但反向传播神经网络(BPNN)是一种非常常用的方法,被广泛地应用于不同的加工过程。Yang等人将砂轮粒度、砂轮速度、工件速度和径向进给作为模型输入,用粒子群优化的反向传播神经网络预测磨削表面粗糙度。Zain等人为获得铣削加工表面粗糙度预测的最佳性能,在反向传播神经网络的隐藏层中尝试了不同的层数和结点。结果表明,3-1-1网络结构具有最佳的预测性能。Sizemore等人指出,与分析和理论模型相比,反向传播神经网络可以提高对单点金刚石车削锗的表面粗糙度预测的准确性。实验显示,基于虚拟量测的粗糙度预测比R响应面法等理论模型具有更高的预测精度,这不仅可能提高预测精度,而且t对实施自动化生产和机床的数字孪生体提供可能性。
研究人员将基于虚拟量测的表面粗糙度预测应用于不同的加工过程,以不同的传感器数据作为模型输入。Kong等人利用从振动信号中提取的时域特征来预测表面粗糙度。主成分分析(PCA)和基于集成径向基函数的核PCA被用于减少特征。Wu等人提取了表面的振动信号特征。通过相关分析筛选出具有高优先级的特征。Lin等人使用加速器振动信号结合深度学习预测模型来预测表面粗糙度。Fang等人利用从力和振动传感器收集的数据对加工铝合金的表面粗糙度做了神经网络建模和预测的研究。Lin等人提出了基于切削参数(主轴转速、切削深度和进给率)和铣削过程中的加工振动对加工件进行表面粗糙度建模。大多数表面粗糙度预测只使用一种或两种类型的传感器数据作为模型输入。
在本文中,我们将加速度传感器、电流传感器和力传感器安排在数控机床上,以检测铣削过程中的信号,并探索什么样的输入可以使模型达到最高的预测精度。更重要的是,现有的以信号为输入的基于机器学习的预测方法缺乏对原始信号的详细的数据预处理流程。为了弥补上述差距,本文研究了在铣削过程中单信号或多信号输入下的表面粗糙度的预测,并对提出了信号数据的详细预处理流程,并与传统的三层反向传播神经网络相结合,实现铣削粗糙度的自动预测。本文的其余部分组织如下:用于铣削表面粗糙度预测的反向传播神经网络章节介绍了提出的方法,包括传统的三层反向传播神经网络和用于铣削粗糙度预测的详细的数据预处理流程。案例研究部分介绍了一个案例,其中包含了一个真实的铣削实验的设计,实际的数据预处理,以及模型的构建过程。预测结果与分析章节展示了粗糙度预测结果和讨论。最后是本文的结论。
2、用于铣削表面粗糙度预测的反向传播神经网络
铣削粗糙度预测的数据预处理流程和模型构建的结构如图1所示。数据预处理过程可分为五个步骤,包括数据分割、从时域数据到频域数据的离散傅里叶变换、特征提取、重要特征选择和样本增强。预测模型基于一个三层的反向传播神经网络,它将数据预处理过程中选择的特征作为模型输入,将表面粗糙度作为模型输出。各部分的细节讨论如下。
图 1 数据预处理程序的结构和用于立铣刀表面粗糙度预测的模型构建
2.1 反向传播神经网络
反向传播神经网络是一个由多层神经元堆积而成的网络。它可以塑造特征和表面粗糙度之间的非线性关系。反向传播神经网络的输入是选定的特征,如脉冲系数、裕度因子、峰值等。每个神经元对应于一个特征,如公式1所示 [43],输入特征通过权重和偏置与中间层连接,然后由激活函数激活,中间层和输出层的连接也是如此。输出神经元对应的是表面粗糙度。
其中,alj表示第l中第j个神经元的激活值,a(l-1)k表示第(l-1)层中第j个神经元的激活值,f_1是激活函数。ω_jk^1表示第(l-1)层中第k个神经元到第l层中第j个神经元的连接权,b_j^1表示第l层中第j个神经元的偏差。损失函数用来计算每次迭代中由前向传播计算的表面粗糙度与测量的表面粗糙度之间的差值。训练在多次迭代更新后完成。方程式中说明的平均绝对百分比误差。公式2是为了评估同一数据集在不同预测模型上的预测性能。
其中, ^yi表示预测的表面粗糙度,yi表示实际测量得到的表面粗糙度。
2.2 反向传播神经网络的数据预处理
虚拟量测中的数据分为两类,一类是过程数据,另一类是实际测量的数据。过程数据表示为 , xij= 1, 2. . .m ,j = 1, 2, . . . n, 其中下标 i 表示传感器类型,下标 j 表示采样点。其对应的测试粗糙度值yk ,k = 1, 2, . .l 为计量数据。然后,xij被分成训练数据集xtra,ij和测试数据集xtes,ij。相应地, yk被分成ytra,k和ytes,k。xtra,ij和ytra,k用于训练模型中的参数,xtes,ij和ytes,k用于检验训练模型的预测精度。
2.3 数据分割
如图1的步骤1数据分割所示,信号值一开始是在零左右,这是由于机床刀具在铣削过程开始时没有接触工件。那些接近零的信号片段应该被识别并删除。由于不同信号的数据是在同一时间采集的,它们的有效数据段分布在同一位置。因此,一旦确认了x方向振动数据的有用数据的位置,其他传感器的有用数据就也可以成功截取出来。
例如,如果x1,31000到x1,42600是x方向振动数据的有用部分,x2,31000到x2,42600也应该是y方向振动数据的有用部分。以下是获取xlj有用数据的数据分割步骤:
1. 加载x方向的振动原始数据xlj 。
2. 根据原始数据的长度决定窗口Ws的大小,用Ws将xlj分成多个部分。
3. 计算每个窗口中数据的均方根值。
4. 挑选均方根值高于阈值的窗口。
很明显,无用数据窗口的均方根值低于由有效数据窗口的均方根值。因此,阈值被设定为一个动态值,它与有效过程数据窗口的均方根值相关,并略低于该值。
5. 记住4中窗口的序列号,从具有相同序列号的其他传感器中截取出有用数据。
2.4 时域到频域的转换
步骤2专门适用于振动数据。如公式3中,离散傅里叶变换将振动数据从时域转换到频域。例如,采样点的数量约为424000,所以对于这个点序列x[n]o≤n≤N,N=424000 , 其离散傅里叶变换显示如下。
奈奎斯特采样定理证明,如果对一定带宽的有限时间内的连续信号进行采样,当采样率达到一定值时,在接收端可以根据这些采样值准确还原原始信号。为了避免原始波形的 "半波损耗",采样率至少应该是信号最高频率的两倍。所以在下面的实际特征提取过程中,频率低于10k的信号可以用20k的采样率完全准确地重建。
2.5 特征提取
12个时域特征被提取出来。提取的特征是平均值、方差、标准差、均方根值、峰值、波形因子、峰值因子、裕度因子、脉冲因子、峰值因子、均方根振幅和偏度。提取了五个频域特征:重力频率、均方频率、均方根频率和频率方差。时域特征是从原始电流和力传感器中提取的。时域和频域特征都是针对振动提取的。总共有123个特征。108个时域特征是从三个电流传感器、三个方向的力传感器和加速器传感器中提取的。15个频域特征来自加速器传感器的三个方向。
2.6 特征选择
无用的特征会破坏模型的预测精度。特征选择就是要把这些无用的特征清除掉。皮尔逊相关性,如公式4所示,计算每个特征和实际测量的表面粗糙度之间的关系。皮尔逊相关性表示为rfi,y , 其范围为-1到1。当接近1、-1或0时,特征和表面粗糙度分别为正相关、负相关或不相关。
根据rfi,y,i=[1,2,....123]的绝对值对所有特征进行排名, 只选择相关性排名前20%的特征作为反向传播神经网络的输入。
2.7 样本增加
当样本数量有限时,样本增强可以提高模型的预测精度。从 "数据分割 "部分获得的有用过程数据被称为xi , 其中 i表示传感器类型。如图1的步骤5数据分割所示,在样本增强之前,一组过程数据及其相应的实测数据被表示为{xi,yi} 。经过f次的样本扩增,每个样本被分成f个部分。因此,一个样本{xi,yi} 被扩展为f个样本:{xi1,yi} ,{xi2,yi}..{xf,yi}。这些过程数据共享相同的表面粗糙度。
3 案例研究
3.1 三因素四水平正交实验设计
实验在BOCHI VMC 850B上进行,它是一个三轴数控加工中心。刀具为S4GS1025073 JF530M的四刃高性能整体硬质合金,由贵州金丰精密工具制造。切削刀具的总长度为73毫米,刀具半径为10毫米,刃长为33毫米。工件的材料是45号钢。切削深度、主轴转速和进给率是影响表面粗糙度的主要因素。
在这三个因素的变化下,设计了三因素四水平正交实验。根据刀具和工件的材料硬度,以及刀具制造商推荐的切削参数,将切削深度设定为1毫米、3毫米、5毫米和7毫米;将主轴转速设定为3800转/分、4200转/分、4600转/分和5000转/分,将进给速度设定为760毫米/分、840毫米/分、920毫米/分和1000毫米/分。工件为长125毫米、宽125毫米、高150毫米的立方体,如图2(a)所示。
工件表面分三层进行铣削,每层以相等的间隔铣出8个槽,如图2(b)所示:第一层、第二层和第三层分别标记为绿色、粉红色和蓝色。在第一层中,八个槽中的四个具有相同的1毫米切削深度,同时具有不同的主轴速度和进给率。八个槽中的另外四个具有3毫米的切割深度。同样,在第二层,8个槽中的4个有5毫米的切割深度;其他4个槽有相同的7毫米的切割深度。为了增加样品的多样性,我们增加了第三层,八个表面的切割深度分别设置为1毫米、2毫米、3毫米、4毫米、5毫米、6毫米、7毫米和8毫米,在切割过程中,进给率和主轴转速也在变化。图2(c)是铣削后在x-y平面上的实际表面图。表面粗糙度Ra是用便携式粗糙度仪在每个槽的底面测量的。
图2. 平面铣削过程的实验计划
图3显示了铣削实验的硬件安装。加速度传感器被磁吸在机床的主轴上。力传感器用螺栓固定在工件下面,三个霍尔电流传感器分别夹在机床控制柜的u相、v相和w相输出线上。参照反向传播神经网络的数据预处理部分的第一段,在这种情况下:过程数据为 {x1j,x2j,...x7j}, 其中x1j代表来自u相电流传感器的过程数,x2j代表来自v相电流传感器的过程数据,x3j代表来自w相电流传感器的过程数据,x4j代表来自x方向加速度传感器的数据,x5j代表来自y方向加速度传感器的数据,x6j代表来自z方向加速度传感器的数据,x7j代表来自力传感器的数据。
图3. 传感器和粗糙度检测仪在数控机床上的安装
3.2 数据分割实例
正如在用于铣削表面粗糙度预测的反向传播神经网络中的数据分割部分所述,所有的过程数据都是以x方向的振动数据x1j为标准进行分割的。Wx为 5000, x1j的原始长度为 424000, 所以x1j被分成85个部分。选择大于15的均方根作为有用部分,其对应的采样点为17.5万至37万。据此,其他过程数据在相同的位置进行切割。
3.3 特征选择实例
对于任何单一相位的电流传感器和力传感器,都有12个时域特征。对于加速度传感器的任何单一方向,有12个时域特征和5个频域特征。总共有123个特征。通过使用在特征选择部分说明的方法,在python中计算这些特征和粗糙度值之间的皮尔逊系数。图4-5是皮尔逊相关系数R值。根据R的绝对值对特征的重要性进行排序,从51个重要的振动信号中选出10个。详细来说,它们是X方向脉冲系数、X方向余量系数、X方向峰值系数、X方向峰度系数、X方向偏斜度、Y方向偏斜度、Z方向偏斜度、X方向重力频率、X方向均方根频率、X方向均方频率。此外,在36个关键特征中,有7个是从切割信号中选出的。它们是w相偏度、u相偏度、u相峰度系数、v相平均值、w相峰度系数、u相裕度系数、u相脉冲系数。同样,36个重要特征中的7个来自力信号。它们是X方向的波形指标,Y方向的偏度,X方向的裕度系数,Y方向的标准偏差,X方向的脉冲因子,Y方向的峰值因子,Z方向的峰度因子。每个信号选择的重要特征和所有特征的组合将分别作为我们提出的模型的输入。从特征选择的结果可以看出,大多数重要的特征来自X方向,这意味着实际测量的表面粗糙度与X方向的信号有较高的相关性。这种现象是合理的,因为切削工具是沿x方向铣削的。
图4. 时域特征的R值
图5. 频域特征的R值
3.4 样本增强实例
经过实际的数据分割,原始数据被分割成长度为195000的片段。然后将它们分成100块,所以每块数据的长度为1950。在我们的案例中,原来的24个样本被扩充为2400个样本。换句话说,有一百个不同的原始信号,有1950个尺寸,共享同一个表面粗糙度标签。此外,对于扩增后的数据,根据实用特征选择一节,选择重要的特征。
3.5 三层神经网络模型的构建
一个三层的BPNN被用来作为预测模型。该模型的输入可以是来自单一传感器的特征,也可以是来自任何两类或所有三类传感器组合的特征。在样本增强后,有2400组样本。2400个样本被分割成训练数据集和测试数据集。其中80%(1920组)被用作训练数据集,20%(480组)被用作测试数据集。训练数据从不重复用于测试。测试数据集的预测准确率用于评估模型性能。在本文中,用于不同模型的训练和测试数据集对每个模型都是相同的。为了满足更好的预测精度,在连续的模型训练实验中,中间层的神经元数量会发生变化。如图6所示,隐藏层中神经元数量的变化影响了预测的准确性。通常情况下,根据第一层的神经元数量,中间层的神经元数量要少于第一层的神经元数量,但要大于1。对于振动信号,有10个重要的特征被提取出来,所以输入层的神经元数量是10个,因此,对于振动信号,隐藏层的节点数量设置为3到9个。同样,对于电流和力的信号,隐藏层的节点数从3到6。每个参数的实验都要重复五次以确保可靠性。一般来说,预测精度随着中间层节点数的增加而增加。
图6. 隐藏层中的神经元个数对预测准确性的影响
4 预测结果和比较
在介绍部分,我们提到了很多应用于表面粗糙度预测的预测方法,包括支持性向量回归(SVR)、套索、多线性回归(MLR)、高斯过程回归(GPR)、极端学习机(ELM)和一维卷积神经网络。除了一维卷积神经网络之外,其他传统的机器学习方法都是以手工特征作为其模型的输入。
然而,作为一种深度学习方法,一维卷积神经网络具有自动提取特征的能力,通常在原始传感器数据上进行输入。一维卷积神经网络由一个卷积层、一个最大池化层和一个全连接层组成。它的输入是经过实际数据分割和数据增强的原始数据。一维卷积神经网络的输入数据与本文中其他方法的区别在于,一维卷积神经网络的输入数据不需要特征提取和重要的特征选择步骤。作为深度学习和传统机器学习方法的代表,一维卷积神经网络和本文提出的方法都是用python编码的,并在本节中首先进行比较。为了验证哪种类型的传感器数据对构建高预测精度模型的贡献更大,当电流传感器、振动传感器、力传感器和三者的组合作为一维CNN和建议方法的输入时,预测结果分别显示在图7-10中。
图7. 仅使用力传感器数据作为模型输入的预测结果
图8. 仅使用振动传感器数据作为模型输入的预测结果
图9. 仅使用力传感器数据作为模型输入的预测结果
图10. 使用所有传感器数据的组合作为模型输入的预测结果
在每个图中,尽管测试数据集有480个样本,但由于空间的限制,480个样本中只有66个被显示在图中。红色代表所提出的方法的预测结果,绿色代表一维卷积神经网络的预测结果,黑色代表测量的表面粗糙度。无论选择哪种信号作为模型输入,一维卷积神经网络的预测精度都比本文提出的方法差。如图7所示,当电流信号作为模型输入时,建议的方法和卷积神经网络的MAPE(见公式2)都超过20%,这表明只有单一的电流信号不能精确预测表面粗糙度。在图8中,当振动信号为模型输入时,建议方法的MAPE为7.58%。当力信号为模型输入时,建议的方法的MAPE为6.59%。当只选择一个信号作为模型输入时,力信号的表现最好。此外,图10是将组合信号作为模型输入时的预测结果。很明显,组合信号与实际测量的表面粗糙度完全吻合,所提出的方法的MAPE为1.01%。
为了证实所提出的预测方法的有效性,图11对所提出的方法和其他机器学习方法做了进一步的比较,这些方法在综合传感器数据作为模型输入时需要手工制作特征。Python已经封装了这些传统的机器学习方法,所以除了极限学习机和高斯过程回归方法外,其他方法的代码都是用python编码,并直接从sklearn库中调用。极限学习机和高斯过程回归是在matlab中编码的。所有这些传统方法与我们提出的方法共享相同的训练和测试数据集。这些模型的输入是来自所有信号组合的特征。图11清楚地显示,传感器数据和表面粗糙度是非线性相关的,因为最差的预测结果来自多元线性回归和lasso,分别为15.5%和23.7%。ELM、SVR和GPR的预测结果分别为5.74%、3.56%和2.21%。这些具有手工特征的机器学习方法比具有自动特征提取能力的一维CNN持有更好的性能。这可能是因为在我们的案例中,数据集的规模相对较小或多样性不足,不足以满足训练有素的一维CNN模型。所有代码都在Interl core i7第九代CPU中运行,编译环境为python3.7中的tensorfolw 2.11.0。
图11. 不同机器学习预测模型的预测准确性比较
5 结论
本文提出了一个用于数控机床行为映射的表面粗糙度虚拟量测模型。提出了一个创新的、详细的数据预处理程序,包括数据分割、时域到频域转换、特征提取、特征选择和样本增强。为构建一个有很好预测精度的虚拟量测模型,采用了三层反向传播神经网络。为了验证所提方法的有效性,设计并实施了一个正交实验,用于收集实时传感器数据和真实测量的表面粗糙度数据。
在不同类型的模型输入下,一些传统的机器学习方法和具有自动特征提取能力的深度学习方法一维卷积神经网络与所提出的预测方法进行了比较。就预测精度而言,在我们的案例中,传统的机器学习方法比一维卷积神经网络的表现更好。特别是在这个铣削案例中,所提出的模型比一维卷积神经网络和其他传统的机器学习方法表现得更好。
在模型输入方面,当单一信号作为模型输入时,力信号的预测性能最好,MAPE为6.59%,然后是振动信号,MAPE为7.58%,而电流信号的MAPE为22.99%。组合信号作为模型输入大幅提高了预测精度,MAPE为1.01%。当模型输入更加多样化时,模型预测准确率会提高。这种方法的目的是揭示现象而不是解释粗糙度预测机制。未来的工作将集中在可追溯性上,例如通过信号和刀具磨损之间的联系来解释表面粗糙度变差的原因。
关注公众号,后台回复“DT33”即可下载原文
DigiTwin2025
相关阅读
本公众号致力于分享高质量的数字孪生与数字工程相关学术研究与知识资讯,以促进学术交流与知识传播。推送的论文内容主要来源于公开出版或在线发布的学术资源,版权归原作者所有,仅供学术交流,未经授权不得商用。如有侵权,请联系删除。
如您有优秀论文需推荐,或者成果发布、企业进展、科研交流等需求,请在公众号后台留言,或发送邮件到digitaltwin@buaa.edu.cn,与我们取得联系。感谢您的持续关注与支持!