课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

文摘科技 2024-09-28 07:01 江苏

课题组硕士研究生韩辉的研究成果发表在了工业人工智能领域一区TOP期刊Computers in Industry，论文题目“TDAD: Self-Supervised Industrial Anomaly Detection with a Two-Stage Diffusion Model”，主要研究工业制造场景下多样化产品的异常检测方法，针对异常类型的复杂性和数据注释的高成本问题，提出了一种基于两阶段扩散模型的自监督学习框架TDAD。

论文主要创新点是提出了一个基于两阶段扩散模型的自监督学习框架TDAD，用于图像异常检测和定位任务。TDAD包括异常合成、图像重建和缺陷分割三个模块，以端到端的方式进行判别性训练，目的是提高异常的像素级分割精度并降低误检率。通过从正常样本中合成异常，设计基于扩散模型的重建网络，并结合多尺度语义特征融合模块进行缺陷分割。整体框架如图1所示。

图 1 TDAD整体框架

由于仅使用正常样本进行模型训练无法获得异常的先验信息，因此本文采用在线合成伪异常的方法进行端到端训练。异常合成的总体流程如图2所示。区域掩膜N主要以两种方式生成，一是叠加二值化Perlin噪声图产生多个缺陷区域；二是叠加连续大面积不规则异常区域，产生多尺度异常区域。本文将DTD数据集与正常样本本身特征相结合，通过图像增强生成异常纹理。

图2 异常合成策略整体流程

本文的图像重建网络由两阶段扩散模型构成，其结构如图1所示，涉及两个扩散过程。首先，模型引入潜在扩散模型，异常图像通过预训练的VQVAE编码器编码到特征空间，得到特征。随后，它经过一阶段的低噪声、高采样步长无条件扩散过程和二阶段的高噪声、高采样步长条件指导扩散过程，得到重建的正常特征。该特征由VQVAE解码器解码以产生高质量重建图像，整体流程见算法1。一阶段过程保留了原始样本的主要语义特征，同时消除了缺陷特征，二阶段过程则是对图像细节部分进行增强，提高重建质量，如图3所示。

算法1 两阶段扩散重建过程

图3 不同阶段的重建图像

缺陷分割网络采用类似U-Net的结构（如图4所示），编码器和解码器采用跳跃连接提供必要的语义信息。然而，直接通过跳跃连接中的级联融合编码器和解码器特征映射会导致语义歧义，因为语义存在显著差异。为了解决这个问题，本文在跳跃连接之间引入了多尺度语义特征融合（MSF）模块，如图5所示。

图4 缺陷分割网络的结构

图5 多尺度语义特征融合（MSF）模块的结构

在图像重建过程中，TDAD使用预训练的VQVAE压缩图像，解码阶段的卷积网络可能引入噪声导致误检。为此，本文将特征级异常分数（）集成到分割网络中，以细化像素级异常分数（）。由编码特征和重建特征的欧几里得范数计算得到并通过平滑模块（图6）进行平滑处理，最终经过高斯滤波获得。

图6 异常得分平滑模块

为评估提出的TDAD模型，本文在实验部分使用了两个基准数据集：MVTec AD和VisA。实验采用三种衡量指标：图像级AUROC、像素级AUROC和PRO。

在对比实验中，本文在MVTec AD和VisA数据集上将TDAD分别与经典和最先进（SOTA）方法进行了比较，并得出定量和定性结果（表1、表2，图7、图8）。从图表中可以看出，本文的方法在异常检测和定位中均达到了最佳的测试性能。

表1 MVTec上的异常检测和定位结果

图7 MVTecAD数据集不同类别的异常定位结果可视化

表2 VisA上的异常检测和定位结果

图8 VisA数据集不同类别的异常定位结果可视化

在工业领域，运算速度与检测准确率同样重要。为了评估工业检测中模型运行效率，比较了不同方法对单幅图像的推理速度，结果如表3所示。相较于先前基于DDPM和DDIM的异常检测扩散模型，TDAD在计算速度上表现出显著的提升。总体而言，TDAD的运行效率足以满足大多数工业产线的生产需求。

表3 各种模型在MVTec的单张图像推理时间和检测精度

为了评估提出的TDAD的必要性，本文对异常合成方法、两阶段扩散模型的步骤、缺陷分割模型的构成模块和异常得分的像素数选择进行了消融实验。

本文将异常合成方法与DRAEM和CutPaste网络中使用的方法进行了定量比较，结果如图9所示，这表明合成异常的多样性和真实性增强了模型从训练集推广到未知异常的能力，从而提高了检测准确性。

图9 不同异常合成方法在MVTec上的检测效果

为分析重建网络中两个扩散阶段和中间特征融合模块的效果，本文通过控制变量分别从检测效果和图像质量的角度评估每个模块的重要性，结果见表4。图10直观的显示出，经过模型重建后，异常样本基本被调整到与正常样本的特征分布范围接近，而正常样本在重建后仍保留了原有的特征信息。

表4 MVTec上对两阶段扩散模型的消融实验结果

图10 MVTec上典型图像重建的t-SNE可视化

为了验证MSF模块结合平滑后的特征级异常分数对分割网络的精度提升效果，本文设置了如表5所示的定性分析，由数据可见，添加MSF模块有效提升了异常定位精度。从图11可见，平滑后的特征级异常分数对于难以准确重建的复杂纹理的异常分割能力提升尤为显著。

表5 MVTec上的缺陷分割模型消融实验

图11 特征级异常分数在MVTec上的效果比较

实验结果表明，本文所提出的TDAD框架对工业应用具有重要的实际意义，特别是在提高生产线异常检测的效率和准确性方面。TDAD针对合成异常进行判别性训练，无需真实的缺陷样本。这种方法通过结合多样化的合成异常，增强了模型推广到未知异常的能力。两阶段扩散模型能够生成高质量的无异常重建图像，MSF模块与U-Net网络的结合增强了异常分割的能力。通过消除对真实缺陷样本的需求，TDAD减少了模型训练所需的时间和资源，这在缺陷样本稀缺或难以获得的工业生产环境中尤其有利。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247485396&idx=1&sn=ff3bf57ab3ada8f4d4f51ad756febfa5

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于多智能体近端策略优化的有限感知无人艇集群分布式追逃博弈

课题组硕士研究生成果发表在工业人工智能领域TOP期刊IEEE TIM

【论文荐读】滤波融合：图像-激光雷达融合的3D目标检测

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉