标题:MFNet: A Novel Multilevel Feature Fusion Network With Multibranch Structure for Surface Defect Detection
单位:the College of Computer Science, Sichuan University, Chengdu
1、研究背景:
在钢铁行业、瓷砖行业、纺织行业等工业制造行业,表面缺陷检测是保证产品质量不可缺少的程序。传统的手工表面缺陷检测通常由训练有素的人工检测人员进行,这种检测方式是昂贵的,耗时的,并且无法进行自动检测。
为了解决上述局限性,基于特征提取的机器视觉方法被应用于表面缺陷检测,但表面缺陷检测在复杂性方面存在低对比度,微小物体和不规则性等特点,导致基于机器视觉的方法也无法进行检测。所以基于深度学习的方法被提出并运用在缺陷检测方面,比传统的机器视觉方法具有更高的自动化程度,更重要的是,检测性能大大提高。
1、引入改进的ASPP模块,保证网络从底层特征中感知到足够的语义信息,最小化信息丢失。
2、设计多支路解码结构,融合多级特征,将前一支路的特征映射反馈到后一支路的各级,提高网络性能。
3、引入全局上下文通道关注模块,便于多级特征融合,恢复更多缺陷细节。
3、研究方法:
本文中提出了一种具有多分支结构的多层特征融合网络(MFNet)用于表面缺陷检测。网络由编码器网络,改进的ASPP模块(ASPP- A),多分支解码器网络,全局关注模块,深度监督五个部分组成。首先,将缺陷图像输入到网络中,通过编码器网络提取多级特征,通过卷积和池化操作聚合低层次和高层次信息。接着,将这些浅层分支的特征输入到ASPP-A模块中,通过使用不同核的扩张卷积来扩展感受野,以补偿特征提取中的局限性。然后,每个分支通过上采样块(UB)恢复特征图到其原始大小,通过跳跃连接融合不同分支的特征,并调整同一层级不同分支的特征维度使其一致,但在跳跃连接操作之前需要嵌入全局通道注意力模块(GCAM),以便于特征融合并增强网络性能。最后,融合所有分支的输出,以产生最佳的检测结果,如图1所示。
图1 MFNet的总体架构
为了更加准确地检测缺陷,需要尽可能多地使用包含详细信息的低级特征。然而,底层特性缺乏足够的接受野来捕获有用的上下文信息。为此,提出了一种改进的ASPP模块,该模块由卷积块和最大池化块组成,ASPP-A模块架构如图2所示。
图2 ASPP-A模块的架构
图3 UB模块的架构
虽然引入了跳跃连接以合并来自不同分支的相邻特征图,但融合的特征过于粗糙,对缺陷检测效果有限,对此本文提出了一种全局通道注意力模块(GCAM),该模块采用全局最大池化和全局平均池化路径以细化通道交互,GCAM模块的架构如图4所示。
论文的实验部分将提出的MFNet在标准数据集CrackForest、Kolektor、Type-I RSDDs (RSDDs)上进行检测评估,评价指标采用精确率、F1分数、交并比。
通过消融实验验证了MFNet中ASPP-A模块,GCAM模块,ResNet的有效性。在Crackforest数据集上进行消融实验,设计了五种不同的模型分别进行比较,结果如表4所示,每个模块都能够在一定程度上发挥有益的作用,且将所有模块进行组合才能实现最佳性能。
表4 Crackforest数据集消融实验结果
未来还将进一步尝试更有效的数据增强策略以增强缺陷检测能力,且仍将继续优化网络结构,以实现实时和高精度的性能。