【论文荐读】基于目标相关Transformer网络的任务导向深度学习框架在工业质量预测中的应用

文摘   科技   2024-10-16 07:00   江苏  


标题:A task-oriented deep learning framework based on target-related transformer network for industrial quality prediction applications

期刊:Engineering Applications of Artificial Intelligence 133 (2024) 108361
作者:Yalin Wang, Rao Dai, Diju Liu , Kai Wang, Xiaofeng Yuan, Chenliang Liu

单位School of Automation, Central South University, Changsha, China

1、研究背景:

关键质量变量的检测任务在工业生产过程中对操作优化和决策具有直接影响,但常常受到恶劣环境和检测仪器的限制。因此,关键质量变量的实时预测任务已成为工业过程优化控制的基础。

目前,基于数据驱动的软测量建模技术得到了广泛的关注和应用,特别是在时间序列分析、故障检测等领域。虽然基于Transformer的方法已经扩展到工业数据建模中,但是面对不同的任务需求,仍然无法达到最优的性能。造成这种情况的主要原因在于缺乏有效的特征筛选机制,导致模型提取的特征偏向于数据的整体特征而忽略了任务特征。

2、论文创新点:

为了解决上述问题,本文提出了一种新的目标相关自注意力(TR-SA)机制,通过在任务相关目标变量和其他变量之间添加注意力分数来指导特征学习。并且基于该机制,提出面向任务的深度学习框架。

(1)设计了一种目标相关自注意力机制(TR-SA),将任务信息引入到建模过程中,防止任务相关信息在特征提取时被淹没。

(2)提出了一种基于TR-SA的Transformer架构(TR-Former),旨在通过逐层提取任务相关特征,以提升动态工业过程的数据驱动建模性能。

(3)将提出的TR-Former方法应用于两个真实的工业过程数据集,证明其相对于目前较新的方法(7种)的优越性能。

3、研究方法:

1)目标相关的自注意力机制(TR-SA)

目标变量对自注意力机制的计算至关重要,可以使后续的特征学习有利于增强模型的预测性能。针对这一问题,本研究提出一种新颖的目标相关自注意力(target-related self-attention,TR-SA)机制,全面探索协变量与质量变量之间的相关性,以弥补原有自注意力机制在特征提取方面的不足。

它主要包括四个步骤,如图1所示,分别是数据准备、特征字典生成、特征提取、特征融合。

图1 TRSA框架图

①数据准备:为充分利用工业过程中采集的数据样本,首先将获取的数据样本分为输入样本和目标样本。然后,将它们输入到TR-SA中并进行映射,得到协变量表示XR和目标变量表示TR

②特征字典生成:协变量XR被映射到查询矩阵QX和键值对,进行自相关匹配。与此同时,目标变量TR生成查询矩阵QY,并与协变量的键值对进行目标相关匹配。

③特征提取:通过自相关匹配和目标相关匹配,获得了两种不同的注意力信息,分别称为自相关信息(输入数据自身的依赖关系)和目标相关信息(输入数据与目标变量之间的依赖关系)。

④特征融合:将自相关信息和目标相关信息这两个特征矩阵相加得到最终的特征信息EF

2)面向任务的目标相关Transformer模型

为了提高工业质量预测的性能,本文提出了一种面向任务的目标相关Transfomer网络(TR-Former),如图2。使用TR-SA替换传统Transformer网络中的多头自注意力机制来增强网络的特征提取能力。

TR-Former去除了解码器模块,可以减少计算量,消除解码器带来的误差积累。

图2 TR-Former示意图

3)基于TR模型的质量预测框架

本文提出的TR-Former网络充分考虑了目标变量在特征提取中的引导作用,既能捕捉样本间的依赖关系,又能提取输入变量与目标变量之间的显著特征。因此,本文构建了一个质量预测框架,以此来提高该网络在实际工业过程中质量预测的准确性。

基于TR-Former网络构建质量预测框架的三个阶段,包括准备阶段、训练阶段和测试阶段。

图3 基于TR-Former网络构建质量预测框架

准备阶段:

从实际工业过程中采集数据进行归一化处理。

采用滑动窗口构建数据集,其中每个窗口包含数据的输入序列和相应的预测序列。

将采集到的数据分为训练数据集和测试数据集。

训练阶段:

利用当前输入时间序列数据的辅助变量和目标变量对网络的参数进行预训练。

目标变量为未来输入的时间序列数据,用于监督所有网络参数的微调。通过多次迭代训练得到最优模型并保存网络参数。

测试阶段:

①将测试数据集中输入序列的辅助变量输入到训练好的TR-Former网络中,得到预测结果。

②使用测试数据集中输入序列对应的真实标签值来评估模型的预测性能。

4)钾盐结晶工艺的工业应用

图4为国内某大型盐湖化工公司硫酸钾结晶流程图。由于钾石盐结晶过程的复杂机理和恶劣环境下测量器的限制,整个钾石盐结晶过程的稳定高效生产高度依赖于分级旋流器出料浓度的实时监测,如下图中红色点状线框所示。为了确保模型的准确性,在分级旋流器的外部部署了一台工业相机,实时监测排放浆液的形状,以获得与浓度相关的图像参数。然而,由于现场生产条件和测量仪器的阻碍,排放的浓度测量目前依靠操作人员手动测定。这种作业方式存在主观性强、劳动强度大、实时监控性差等缺点。因此,需要建立数据驱动的质量预测模型对排放浓度进行实时预测。

图4 某大型盐湖化工公司硫酸钾结晶流程图
表1钾盐结晶过程中的辅助变量

基于人工知识和图像识别的先验经验,将6个过程变量和17个图像特征作为辅助变量,构建预测模型框架,如表1。U1~U6表示与结晶器密切相关的6个工艺参数。对工业相机获取的图像数据进行预处理后,提取出口浆料图像的纹理和形状特征。U7~U10为4个纹理特征变量,U11为出风口相对面积,U12~U23为前12个图像特征的傅里叶描述。

实际网络输入中,为了充分利用所获得的数据,将每个标记样本的过程变量U1-U4的前两阶矩添加,作为对标记样本的补充。则构建的质量预测模型的输入变量增加到31个。

图5 用于预测钾盐结晶数据集排放浓度的详细预测曲线

由图5,PCR、SAE、VWSAE等静态方法难以跟踪快速变化的曲线,且在大部分波峰或波谷处误差较大,说明其无法感知曲线中的变化规律。相比之下,动态方法如LSTnet、MVTTrans、Informer、LogTrans等性能较好,能够提取曲线的趋势信息,但在变化较大的波峰或波谷处仍难以达到较高的精度。

这也说明这些方法提取的特征更具有平均化和整体结构化的特点,而不是与建模目标相融合。相比较而言,本文提出的TR-Former通过引入目标提高了模型在剧烈变化时的建模精度,使其整体性能明显优于其他方法。

表2 预测钾盐结晶放电浓度的所有方法的比较结果

从表2结果中可以看出,SAE和PCR的预测性能较差,特别是在RMSE、MAE和MAPE等指标上表现不佳,R²较小。这主要是因为它们是静态线性模型,无法捕捉工业过程数据的复杂非线性特征。虽然VW-SAE也是静态方法,但由于引入了变量相关的指导,其性能明显优于SAE和PCR。在动态方法中,LSTnet表现一般,因为其递归结构会导致累积误差,无法有效提取长期历史特征。相比之下,基于Transformer的MVTTrans、Informer和LogTrans避免了这一问题,但仍因缺乏任务相关信息的指导而表现不佳,提取的特征偏向整体平均,而非建模任务所需的特征。因此,本文提出的TR-Former通过将任务目标融入建模过程,引导模型提取对任务有利的特征,从而实现最佳性能。

为了验证模型的实际性能,我们在实际生产过程中进行了一周多的在线试运行。在整个试验过程中,该模型连续半小时生成浓度预测,用于指导现场操作。尽管TR-Former在钾盐结晶数据集上表现出色,但在实际生产环境中实现极其精确的浓度预测仍然具有挑战性。这是不可理解的,因为与用于模型训练的数据相比,现场数据通常表现出更高的噪声和可变性。尽管如此,这并不会削弱TR-Former为生产人员提供有价值的参考点,协助他们做出运营决策的能力。这证实了实际工业过程顺利实施的实际优势,并推动了TR-Former在结晶车间扩展应用到更多水力旋流器集群的潜力。

5)加氢裂化工艺的工业应用

加氢裂化是炼油和石油化工中生产石油的主要工艺。图6是中国一家化工公司的简单加氢裂化流程图。为了评价当前生产是否满足高效低耗的要求,通常采用轻石脑油中C5(五碳烷烃)含量作为监测指标。

图5 加氢裂变工艺流程图

图6 预测C5含量的详细预测曲线

由图6可见,TR-Former无论是在波浪曲线下,还是在波峰面积急剧变化的情况下,都能取得比其他方法更好的预测效果。

表3 预测加氢裂化过程中C5含量的各方法的比较结果

由表3可见,考虑到SAE、PCR和VWSAE为静态模型,难以捕捉数据的动态特性,导致其预测性能较差。MVTTrans的预测效果相比浅层模型有所改善。LSTnet虽然能够同时捕捉时间序列的长期和短期模式,但是由于序列过长导致梯度消失,无法达到满意的预测效果。

此外,由于稀疏性机制,Informer和LogTrans的预测性能可以略有提升,但仍然没有达到最好的预测性能。提出的TR-Former同时考虑了过程数据的自相关动态特性和目标变量对预测任务指导的作用,使其取得了最好的预测性能。

可见本文提出的TR-Former方法更适合于工业质量预测任务。它在两个工业数据集上的一致性和增强的性能突出了它的鲁棒性和适用性。
4、结论:
本文开发了面向任务的深度学习框架,用于工业过程中重要的质量预测任务。在传统Transformer网络的基础上,结合动态特征和注意力相关性的优势,从质量预测任务的角度构建了一种基于目标相关Transformer(TR-Former)网络的新型质量预测框架。

在两个工业数据集上进行了实验,以验证所提方法的预测性能。从四个预测评估指标可以看出,所提方法与其他典型方法相比有所改进。

智能自主无人系统课题组
智能自主无人系统(IAUS)课题组坚持“面向国家重大科技需求,引领行业技术进步”的思路,专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究,分享和发布最新科研动态及研究成果。
 最新文章