【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

文摘科技 2024-03-22 09:26 江苏

标题：MLDFR: A Multilevel Features Restoration Method Based on Damaged Images for Anomaly Detection and Localization

来源：IEEE Transactions on Industrial Informatics 20.2 (2024): 2477-2486.

作者：Yinghui Guo , Meng Jiang , Qianhong Huang , Yang Cheng , and Jun Gong

单位：Northeastern University; Shenyang University of Chemical Technology; Heilongjiang University

1、研究背景：

异常检测（AD）和异常定位（AL）是工业智能制造的重要组成部分，广泛应用于许多领域。这是具有挑战性的，因为异常类型复杂多样，而且在实际生产中很难获得异常样本。一种常见的方法是无监督学习，旨在学习正常样本的分布，并将其作为识别异常的标准。

在最近的发展中，深度神经网络以更强大的表现学习性能显著地推进了这项任务。在图像空间中，一种直观有效的方法是重建测试样本的正常图像，并利用恢复前后的差异来检测和定位异常。然而，这种像素级图像重建容易受到噪声干扰，导致检测的鲁棒性较差。使用预训练的网络在特征空间中构建特征表示是一种有效的检测方法。然而，存储特征然后检索“正常模板”会产生显著的存储开销，并且对特征的概率分布进行建模会限制模板多样性。

2、论文创新点：

1、MLDFR能够恢复与测试样本最相似的正常特征，并利用恢复前后的差异来实现AD和AL;

2、介绍了一种利用在ImageNet上预训练的CNN和transformer的并行特征提取器，它可以聚合样本的低维纹理和高维语义信息;

3、提出了一种特征恢复模块，该模块可以充分捕捉长距离依赖关系，并提高特征恢复能力。

3、研究方法：

本文提出了一种基于损伤图像的多级特征恢复方法（MLDFR），用于异常检测和定位。MLDFR试图恢复测试样本的“正常特征”。具体为，破坏训练样本以生成相应的样本，然后利用卷积神经网络和在ImageNet上预训练的transformer来设计并行特征提取器，以完全表示样本的多级特征。此外，本文充分考虑了长距离局部特征之间的依赖性，并设计了一个特征恢复模块，如图1所示。

图1 MLDFR的体系结构

叠加噪声、属性消除、拼图恢复和剪切粘贴是构建异常样本的常用方法。与上述方法不同的是，MLDFR不模拟实际缺陷，只任意、不规则地损坏图像。本文认为，受损样本可以保留部分图像结构，这有利于特征恢复。五种不同的破坏模式如图2所示。

图2 随机损伤可视化图

特征提取与融合如图3所示，由于CNN可以提取低水平信息的局部描述符，而ViT具有更宽的感受野，可以提取全局表示和结构信息。由预训练的CNN网络提取的浅层在AD任务中显示出良好的结果，因此本文选择预训练的ResNet18的前三个块中的最后一层的输出来表示低级别信息的局部描述。我们选择预训练的CaiT的深层输出来表示正常样本的高级特征，而选择浅层输出来表示受损样本的高级特性。本文发现CaiT的浅层输出有利于特征恢复。

图3 特征融合模块的结构

特征重建模块基于ViT结构进行设计，因为它具有出色的上下文表示能力。同时参考了CaiT提出的“LayerScale”结构，即在每个残差块的输出中添加了一个可学习的对角矩阵，这有助于提高训练的动态性，并可以训练更深、更大容量的变压器。此外，还在结构中添加一个与多级特征大小相同的位置编码层来形成特征恢复模块，整体结构如图4所示。本文的主要目标损失是特征恢复前后每个通道的平均均方误差（MSE）和整体的余弦相似度。

图4 特征重建模块的结构

论文的实验部分将提出的MLDFR模型在标准数据集MVTec（2019）、BTAD（2021）和MPDD（2021）上进行异常检测评估，评价指标采用图像级和像素级AUROC、PRO。

在对比实验中首先在MVTec上将MLDFR与基于图像相似性的方法和基于特征相似性的方法进行了定量比较，结果如图5所示，可以看出MLDFR实现了最先进的图像水平检测（AUROC 99.4%）和AL（AUROC98.6%，PRO 95.7%）评分。图6、图7分别表示MLDFR在BTAD（2021）和MPDD（2021）数据集上实现的最先进的图像级检测和定位性能。

图5 MLDFR与基于图像相似性和基于特征相似性的方法的定量比较结果

图6 MLDFR等七种方法在MPDD数据集上的定性比较

图7 MLDFR在BTAD数据集上与先前方法的定性比较

为了更好地理解恢复前后特征的判别能力，本文利用t分布随机邻域嵌入（t-SNE）对MVTec数据集样本恢复前后的特征进行可视化，并将其显示在图8中。如图所示，正常特征恢复前后没有显著变化，但异常特征被映射到恢复后的正常特征区域，与之前有显著差异。实验证明，特征恢复模块对正常特征具有可靠的表示能力，保证了MLDFR在各种情况下都具有良好的AD性能。

图9列出了MLDFR与以往工作在推理时间（秒）、内存使用量（MB）方面的比较结果。相比之下，本文结构显著减少了内存使用。在整体性能上，推理时间相对优秀。

最后，通过消融实验，验证了特征提取模块、图像损坏策略、特征重建模块和损失函数以及相关参数对MLDFR的性能影响。图10列出了仅使用CaiT或ResNet18模型和其他主干时选择的不同层输出的结果。可以得出结论：当仅使用CaiT作为特征提取器时，选择正常样本的深层输出和异常样本的浅层输出会产生更好的结果。图11、图12显示了使用不同损伤图像方法和不同损伤参数的定性比较，可见“高斯滤波器、掩模和白色”的平均结果比其他方法要好，适当程度的破坏尤为重要。根据结果，损伤方块的边长设置为输入尺寸的约1/24，损伤方块数量设置为约180，测试结果更好。

图8 测试样本在前后重建的特征的t-SNE可视化

实验运行结果图如下图9所示。基于边界的基线方法通过直线移动来快速行进走廊以增加覆盖区域，而不转向门或房间。而MRMR方法快速转向到达门并进入房间，并且能使机器人没有冗余的情况下唯一地访问每个房间：

图9 推理时间（秒）、内存使用（MB）和性能（AD-AUROC/AL-AUROC）方面的比较

图10 仅使用CaiT或ResNet18模型和其他主干时选择的不同层输出的结果

图11 不同损伤参数的定性比较

图12 不同损伤图像方法的定性比较

图13显示了不同结构的特征恢复模型的定量比较。将对角矩阵引入多层感知（MLP）层，可以大大提高性能，尤其是在结构复杂的数据类型中。同时，大大减少了训练周期。可以充分验证，该对角矩阵有效地聚合了不同通道的重要特征信息，有助于特征恢复。图14中在添加余弦相似性之后，性能显著提高。但如果将使两个分量的比值近似相同的λ设置得太大，则不利于AD和定位。

图13 不同结构的特征恢复模型的定量比较

图14 在损失函数中添加余弦相似性前后的定量比较

4、结论：

在这项工作中，本文将图像恢复的概念引入到特征空间中，并提出了一种新的AD和AL范式。大量实验表明，在这种范式下，只使用简单的损伤方法训练特征恢复模块，就可以获得最新的性能。

近乎完美的图像级检测性能使其成为工业AD应用的可能。这一框架的局限性体现在两个方面。首先，它会增加保留所有提取特征的计算成本，因此可以进一步研究筛选重要特征，以减少推理时间和存储空间。其次，并没有明确的图像损伤方法对所有类型的检测都是最好的。在未来的工作中，可以在指定的数据集上进一步研究自适应损伤方法，以提高AD的性能。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247484826&idx=1&sn=8bc1f97f1cc149e4220ac2aec5b0fdb0

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于多智能体近端策略优化的有限感知无人艇集群分布式追逃博弈

课题组硕士研究生成果发表在工业人工智能领域TOP期刊IEEE TIM

【论文荐读】滤波融合：图像-激光雷达融合的3D目标检测

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉