【论文荐读】基于目标相关Transformer网络的任务导向深度学习框架在工业质量预测中的应用

文摘科技 2024-10-16 07:00 江苏

标题：A task-oriented deep learning framework based on target-related transformer network for industrial quality prediction applications

期刊：Engineering Applications of Artificial Intelligence 133 (2024) 108361

作者：Yalin Wang, Rao Dai, Diju Liu , Kai Wang, Xiaofeng Yuan, Chenliang Liu

单位：School of Automation, Central South University, Changsha, China

1、研究背景：

关键质量变量的检测任务在工业生产过程中对操作优化和决策具有直接影响，但常常受到恶劣环境和检测仪器的限制。因此，关键质量变量的实时预测任务已成为工业过程优化控制的基础。

目前，基于数据驱动的软测量建模技术得到了广泛的关注和应用，特别是在时间序列分析、故障检测等领域。虽然基于Transformer的方法已经扩展到工业数据建模中，但是面对不同的任务需求，仍然无法达到最优的性能。造成这种情况的主要原因在于缺乏有效的特征筛选机制，导致模型提取的特征偏向于数据的整体特征而忽略了任务特征。

2、论文创新点：

为了解决上述问题，本文提出了一种新的目标相关自注意力（TR-SA）机制，通过在任务相关目标变量和其他变量之间添加注意力分数来指导特征学习。并且基于该机制，提出面向任务的深度学习框架。

（1）设计了一种目标相关自注意力机制（TR-SA），将任务信息引入到建模过程中，防止任务相关信息在特征提取时被淹没。

（2）提出了一种基于TR-SA的Transformer架构（TR-Former），旨在通过逐层提取任务相关特征，以提升动态工业过程的数据驱动建模性能。

（3）将提出的TR-Former方法应用于两个真实的工业过程数据集，证明其相对于目前较新的方法（7种）的优越性能。

3、研究方法：

1）目标相关的自注意力机制（TR-SA）

目标变量对自注意力机制的计算至关重要，可以使后续的特征学习有利于增强模型的预测性能。针对这一问题，本研究提出一种新颖的目标相关自注意力（target-related self-attention，TR-SA）机制，全面探索协变量与质量变量之间的相关性，以弥补原有自注意力机制在特征提取方面的不足。

它主要包括四个步骤，如图1所示，分别是数据准备、特征字典生成、特征提取、特征融合。

图1 TRSA框架图

①数据准备：为充分利用工业过程中采集的数据样本，首先将获取的数据样本分为输入样本和目标样本。然后，将它们输入到TR-SA中并进行映射，得到协变量表示XR和目标变量表示TR。

②特征字典生成：协变量XR被映射到查询矩阵QX和键值对，进行自相关匹配。与此同时，目标变量TR生成查询矩阵QY，并与协变量的键值对进行目标相关匹配。

③特征提取：通过自相关匹配和目标相关匹配，获得了两种不同的注意力信息，分别称为自相关信息（输入数据自身的依赖关系）和目标相关信息（输入数据与目标变量之间的依赖关系）。

④特征融合：将自相关信息和目标相关信息这两个特征矩阵相加得到最终的特征信息EF。

2）面向任务的目标相关Transformer模型

为了提高工业质量预测的性能，本文提出了一种面向任务的目标相关Transfomer网络（TR-Former），如图2。使用TR-SA替换传统Transformer网络中的多头自注意力机制来增强网络的特征提取能力。

TR-Former去除了解码器模块，可以减少计算量，消除解码器带来的误差积累。

图2 TR-Former示意图

3）基于TR模型的质量预测框架

本文提出的TR-Former网络充分考虑了目标变量在特征提取中的引导作用，既能捕捉样本间的依赖关系，又能提取输入变量与目标变量之间的显著特征。因此，本文构建了一个质量预测框架，以此来提高该网络在实际工业过程中质量预测的准确性。

基于TR-Former网络构建质量预测框架的三个阶段，包括准备阶段、训练阶段和测试阶段。

图3 基于TR-Former网络构建质量预测框架

准备阶段：

①从实际工业过程中采集数据进行归一化处理。

②采用滑动窗口构建数据集，其中每个窗口包含数据的输入序列和相应的预测序列。

③将采集到的数据分为训练数据集和测试数据集。

训练阶段：

①利用当前输入时间序列数据的辅助变量和目标变量对网络的参数进行预训练。

②目标变量为未来输入的时间序列数据，用于监督所有网络参数的微调。③通过多次迭代训练得到最优模型并保存网络参数。

测试阶段：

①将测试数据集中输入序列的辅助变量输入到训练好的TR-Former网络中，得到预测结果。

②使用测试数据集中输入序列对应的真实标签值来评估模型的预测性能。

4）钾盐结晶工艺的工业应用

图4为国内某大型盐湖化工公司硫酸钾结晶流程图。由于钾石盐结晶过程的复杂机理和恶劣环境下测量器的限制，整个钾石盐结晶过程的稳定高效生产高度依赖于分级旋流器出料浓度的实时监测，如下图中红色点状线框所示。为了确保模型的准确性，在分级旋流器的外部部署了一台工业相机，实时监测排放浆液的形状，以获得与浓度相关的图像参数。然而，由于现场生产条件和测量仪器的阻碍，排放的浓度测量目前依靠操作人员手动测定。这种作业方式存在主观性强、劳动强度大、实时监控性差等缺点。因此，需要建立数据驱动的质量预测模型对排放浓度进行实时预测。

图4 某大型盐湖化工公司硫酸钾结晶流程图

表1钾盐结晶过程中的辅助变量

基于人工知识和图像识别的先验经验，将6个过程变量和17个图像特征作为辅助变量，构建预测模型框架，如表1。U1~U6表示与结晶器密切相关的6个工艺参数。对工业相机获取的图像数据进行预处理后，提取出口浆料图像的纹理和形状特征。U7~U10为4个纹理特征变量，U11为出风口相对面积，U12~U23为前12个图像特征的傅里叶描述。

实际网络输入中，为了充分利用所获得的数据，将每个标记样本的过程变量U1-U4的前两阶矩添加，作为对标记样本的补充。则构建的质量预测模型的输入变量增加到31个。

图5 用于预测钾盐结晶数据集排放浓度的详细预测曲线

由图5，PCR、SAE、VWSAE等静态方法难以跟踪快速变化的曲线，且在大部分波峰或波谷处误差较大，说明其无法感知曲线中的变化规律。相比之下，动态方法如LSTnet、MVTTrans、Informer、LogTrans等性能较好，能够提取曲线的趋势信息，但在变化较大的波峰或波谷处仍难以达到较高的精度。

这也说明这些方法提取的特征更具有平均化和整体结构化的特点，而不是与建模目标相融合。相比较而言，本文提出的TR-Former通过引入目标提高了模型在剧烈变化时的建模精度，使其整体性能明显优于其他方法。

表2 预测钾盐结晶放电浓度的所有方法的比较结果

从表2结果中可以看出，SAE和PCR的预测性能较差，特别是在RMSE、MAE和MAPE等指标上表现不佳，R²较小。这主要是因为它们是静态线性模型，无法捕捉工业过程数据的复杂非线性特征。虽然VW-SAE也是静态方法，但由于引入了变量相关的指导，其性能明显优于SAE和PCR。在动态方法中，LSTnet表现一般，因为其递归结构会导致累积误差，无法有效提取长期历史特征。相比之下，基于Transformer的MVTTrans、Informer和LogTrans避免了这一问题，但仍因缺乏任务相关信息的指导而表现不佳，提取的特征偏向整体平均，而非建模任务所需的特征。因此，本文提出的TR-Former通过将任务目标融入建模过程，引导模型提取对任务有利的特征，从而实现最佳性能。

为了验证模型的实际性能，我们在实际生产过程中进行了一周多的在线试运行。在整个试验过程中，该模型连续半小时生成浓度预测，用于指导现场操作。尽管TR-Former在钾盐结晶数据集上表现出色，但在实际生产环境中实现极其精确的浓度预测仍然具有挑战性。这是不可理解的，因为与用于模型训练的数据相比，现场数据通常表现出更高的噪声和可变性。尽管如此，这并不会削弱TR-Former为生产人员提供有价值的参考点，协助他们做出运营决策的能力。这证实了实际工业过程顺利实施的实际优势，并推动了TR-Former在结晶车间扩展应用到更多水力旋流器集群的潜力。

5）加氢裂化工艺的工业应用

加氢裂化是炼油和石油化工中生产石油的主要工艺。图6是中国一家化工公司的简单加氢裂化流程图。为了评价当前生产是否满足高效低耗的要求，通常采用轻石脑油中C5（五碳烷烃）含量作为监测指标。

图5 加氢裂变工艺流程图

图6 预测C5含量的详细预测曲线

由图6可见，TR-Former无论是在波浪曲线下，还是在波峰面积急剧变化的情况下，都能取得比其他方法更好的预测效果。

表3 预测加氢裂化过程中C5含量的各方法的比较结果

由表3可见，考虑到SAE、PCR和VWSAE为静态模型，难以捕捉数据的动态特性，导致其预测性能较差。MVTTrans的预测效果相比浅层模型有所改善。LSTnet虽然能够同时捕捉时间序列的长期和短期模式，但是由于序列过长导致梯度消失，无法达到满意的预测效果。

此外，由于稀疏性机制，Informer和LogTrans的预测性能可以略有提升，但仍然没有达到最好的预测性能。提出的TR-Former同时考虑了过程数据的自相关动态特性和目标变量对预测任务指导的作用，使其取得了最好的预测性能。

可见本文提出的TR-Former方法更适合于工业质量预测任务。它在两个工业数据集上的一致性和增强的性能突出了它的鲁棒性和适用性。

4、结论：

本文开发了面向任务的深度学习框架，用于工业过程中重要的质量预测任务。在传统Transformer网络的基础上，结合动态特征和注意力相关性的优势，从质量预测任务的角度构建了一种基于目标相关Transformer（TR-Former）网络的新型质量预测框架。

在两个工业数据集上进行了实验，以验证所提方法的预测性能。从四个预测评估指标可以看出，所提方法与其他典型方法相比有所改进。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247485428&idx=1&sn=b347b1ca28ac5ee99e4660b7d66b0702

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于多智能体近端策略优化的有限感知无人艇集群分布式追逃博弈

课题组硕士研究生成果发表在工业人工智能领域TOP期刊IEEE TIM

【论文荐读】滤波融合：图像-激光雷达融合的3D目标检测

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉