【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

文摘   科技   2024-07-30 06:30   湖北  


标题:MFNet: A Novel Multilevel Feature Fusion Network With Multibranch Structure for Surface Defect Detection

期刊:IEEE Transactions on Instrumentation and Measurement 72(2023):1-11.
作者:Jiangping Zhu,Guohuan He,Pei Zhou

单位the College of Computer Science, Sichuan University, Chengdu

1、研究背景:

在钢铁行业、瓷砖行业、纺织行业等工业制造行业,表面缺陷检测是保证产品质量不可缺少的程序。传统的手工表面缺陷检测通常由训练有素的人工检测人员进行,这种检测方式是昂贵的,耗时的,并且无法进行自动检测。

为了解决上述局限性,基于特征提取的机器视觉方法被应用于表面缺陷检测,但表面缺陷检测在复杂性方面存在低对比度,微小物体和不规则性等特点,导致基于机器视觉的方法也无法进行检测。所以基于深度学习的方法被提出并运用在缺陷检测方面,比传统的机器视觉方法具有更高的自动化程度,更重要的是,检测性能大大提高

2、论文创新点:

1、引入改进的ASPP模块,保证网络从底层特征中感知到足够的语义信息,最小化信息丢失。

2、设计多支路解码结构,融合多级特征,将前一支路的特征映射反馈到后一支路的各级,提高网络性能。

3、引入全局上下文通道关注模块,便于多级特征融合,恢复更多缺陷细节。

3、研究方法:

本文中提出了一种具有多分支结构的多层特征融合网络(MFNet)用于表面缺陷检测。网络由编码器网络,改进的ASPP模块(ASPP- A),多分支解码器网络,全局关注模块,深度监督五个部分组成。首先,将缺陷图像输入到网络中,通过编码器网络提取多级特征,通过卷积和池化操作聚合低层次和高层次信息。接着,将这些浅层分支的特征输入到ASPP-A模块中,通过使用不同核的扩张卷积来扩展感受野,以补偿特征提取中的局限性。然后,每个分支通过上采样块(UB)恢复特征图到其原始大小,通过跳跃连接融合不同分支的特征,并调整同一层级不同分支的特征维度使其一致,但在跳跃连接操作之前需要嵌入全局通道注意力模块(GCAM),以便于特征融合并增强网络性能。最后,融合所有分支的输出,以产生最佳的检测结果,如图1所示

1 MFNet的总体架构

为了更加准确地检测缺陷,需要尽可能多地使用包含详细信息的低级特征。然而,底层特性缺乏足够的接受野来捕获有用的上下文信息。为此,提出了一种改进的ASPP模块,该模块由卷积块和最大池化块组成,ASPP-A模块架构如图2所示

图2  ASPP-A模块的架构

为了提高图像分辨率,细化特征细节以及多尺度特征融合,从而增强模型对缺陷的检测能力和精确度,提出了一种UB模块。该模块由卷积块和上采样组成,UB模块的架构如图3所示。

 

图3 UB模块的架构

虽然引入了跳跃连接以合并来自不同分支的相邻特征图,但融合的特征过于粗糙,对缺陷检测效果有限,对此本文提出了一种全局通道注意力模块(GCAM),该模块采用全局最大池化和全局平均池化路径以细化通道交互,GCAM模块的架构如图4所示。

4 GCAM模块的架构

论文的实验部分将提出的MFNet在标准数据集CrackForest、Kolektor、Type-I RSDDs (RSDDs)上进行检测评估,评价指标采用精确率、F1分数、交并比。

在对比实验中,将MFNet与其他四种缺陷检测方法在CrackForest、Kolektor、RSDDs分别进行定量比较,结果如表1、2、3所示。在CrackForest数据集上,本文提出的方法优于其他模型,特别是在准确率、F1分数和交并比上都达到了最高值,且交并比上达到了60%以上。在Kolektor数据集上,UNet++,Attention UNet和本文方法在准确率上的表现更好,但本文方法获得了最高的F1分数和交并比值。在RSDDs数据集上,可以看到本文所提出的模型在所有指标上始终优于所有竞争方法。MFNet有良好的抗干扰能力,且实现了最佳的检测性能
表1 不同缺陷检测方法在CrackForest上的定量评价结果

表2不同缺陷检测方法在Kolektor上的定量评价结果

表3 不同缺陷检测方法在RSDDs上的定量评价结果

为了验证本文方法的鲁棒性,在CrackForest上进行不同IoU阈值下的定量比较,结果如图5所示。本文方法在召回率-阈值曲线、F1分数-阈值曲线和交并比-阈值曲线方面始终优于其他方法,因此,本文方法具有更好的性能和鲁棒性。

5 基于Crackforest数据集的定量比较。(a) 召回率-阈值曲线;(b) 精确率-阈值曲线;(c) F1分数-阈值曲线;(d) 交并比-阈值曲线。

通过消融实验验证了MFNet中ASPP-A模块,GCAM模块,ResNet的有效性。在Crackforest数据集上进行消融实验,设计了五种不同的模型分别进行比较,结果如表4所示,每个模块都能够在一定程度上发挥有益的作用,且将所有模块进行组合才能实现最佳性能。

表4  Crackforest数据集消融实验结果

4、结论:
为了应对复杂场景中的缺陷检测挑战,本文提出了一种新颖的像素级表面缺陷检测方法,称为MFNet。MFNet采用单一编码器和多分支解码器的结构,通过有效利用多层次特征来增强检测性能。编码器采用预训练的ResNet以捕获丰富的语义信息,而解码器引入了GCAM以促进多层次特征融合并恢复更多的缺陷细节。

未来还将进一步尝试更有效的数据增强策略以增强缺陷检测能力,且仍将继续优化网络结构,以实现实时和高精度的性能

智能自主无人系统课题组
智能自主无人系统(IAUS)课题组坚持“面向国家重大科技需求,引领行业技术进步”的思路,专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究,分享和发布最新科研动态及研究成果。
 最新文章