开源代码 | 基于EfficientNetV2的PCB缺陷检测算法

学术   科技   2024-07-05 11:02   北京  

点击文末 “阅读原文” 下载全文

尹嘉超, 吕耀文, 索科, 黄玺

长春理工大学光电工程学院

引用本文: 尹嘉超, 吕耀文, 索科, 黄玺. 基于EfficientNetv2的PCB缺陷检测算法[J/OL]. 计算机辅助设计与图形学学报,1-10[2024-07-05]. https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00551

Citation: Yin Jiachao, Lyu Yaowen, Suo Ke, Huang Xi. PCB Defect Detection Algorithm Based on EfficientNetv2[J/OL]. Journal of Computer-Aided Design & Computer Graphics, 1-10[2024-07-05]. https://www.jcad.cn/cn/article/doi/10.3724/SP.J.1089.2023-00551


本文代码已开源:https://github.com/ChaO989/Defect_detection

随着电子制造业的发展, 电子产品趋于多功能化、微型化、智能化. 印刷电路板(PCB)作为一种高精密的电子元器件, 其优良与否对电子产品的质量有着重要影响. 但现有的PCB缺陷检测算法存在着检测精度不高, 特别是缺陷定位不够精确等问题. 针对以上问题提出一种基于EfficientNetV2的PCB缺陷检测算法. 在Faster R-CNN的基础上, 通过选用特征提取能力更强的EfficientNetV2_M作为特征提取网络,同时使用通道注意力机制(ECA)对特征融合网络FPN进行优化, 提高了细节信息提取能力. 在北京大学智能机器人开放实验室发布的PCB瑕疵数据集上的实验结果表明改进后的缺陷检测算法相较于目前检测效果最好的PCB缺陷检测算法LWN-Net, 在IoU=0.50时mAP由99.58%提升到99.66%; 在IoU=[0.50:0.95]时mAP由52.6%提升到79.4%.该网络在提升了PCB的检测精度的同时解决了缺陷定位不够精确的问题, 实现了高精度的PCB缺陷检测, 具有一定的实际意义.


改进后的Faster R-CNN模型

改进后的Faster R-CNN模型结构如图1所示, 主要由特征提取网络EfficientNetV2_M, EFPN, 候选区域生成网络(RPN)和计算损失, 以及进行预测的头部网络组成.

图1  改进后的Faster R-CNN网络结构

改进后的Faster R-CNN算法流程图如图2所示.

图2  改进后的Faster R-CNN算法流程

1.  EfficientNetV2
传统的Faster R-CNN骨干网络为VGG16, 模型参数量过大, 尽管它在某些任务上表现良好, 但由于其相对浅层的结构无法有效地提取复杂特征, 导致推理时间较长且检测精度较低, 不能满足对PCB的高要求检测需求. 本文选用模型参数量更小、训练效率更高、特征提取能力更强的EfficientNetV2_M作为Faster R-CNN的骨干网络, 其网络详细参数如表1所示.

为验证骨干网络的有效性, 使用Grad-CAM对骨干网络更换前后进行可视化分析, 结果如图3所示.
图3  Grad-CAM可视化结果

2.  EFPN
在Faster R-CNN的FPN中, 不同特征层具有不同的优势. 低特征层能够保留更多底层细节信息, 更适合用于小目标检测; 而高层特征包含更多语义信息, 更适合用于大目标检测. 为了确定哪些特征层最适合本文的PCB缺陷检测任务, 需要分析PCB缺陷数据集中缺陷的尺寸分布情况, 具体分布如图4所示. 这样的统计分析能够帮助优化特征层的选择, 以更好地满足本文的目标.
图4  PCB数据集GT分布
由图4可以得出, PCB数据集的真实目标大小主要为较小目标适合采用低特征层进行检测, 因此选用低特征层C2C3进行融合, 同时为了获取更多的语义信息, 也将高层特征C8加入到了融合中. 本文在此基础上提出EFPN, 其具体结构如图5所示.

图5  EFPN结构图

3.  损失函数
改进后的Faster R-CNN模型损失函数主要由分类损失和定位损失2部分组成. 分类损失选用的交叉熵损失函数能够很好地衡量模型预测概率分布与实际标签之间的差异, 特别适用于多类别分类问题; 定位损失使用的是Smooth L1损失, 可以帮助提高模型在回归问题中的稳定性, 并减少异常值对损失函数的影响.


实   验

叙事结构抽象方法是叙事可视化的重要组成部分, 通过对叙事结构进行抽象和表示, 可以更好地理解和呈现叙事内容. 本文将叙事结构的抽象方法分为连续性表示、单元式表示和离散化表示3类.

1.  实验数据
本文实验数据集采用北京大学智能机器人开放实验室发布的PCB瑕疵数据集, 后经过镜像、旋转等操作将数据集扩充到10 354张, 其中训练集、验证集、测试集的比例为8⁚1⁚1, 扩充后的数据集中各缺陷实际分布情况如表2所示.
数据集中一共6类缺陷, 分别为缺孔、鼠咬、开路、短路、毛刺和假铜, 各种缺陷如图6所示.
图6  PCB板缺陷图

2.  实验结果与分析
除了连续性表示, 叙事结构的单元式表示也是一种重要的方法. 与连续性表示不同, 单元式表示对时间跨度以及故事之间的紧密程度有着更宽泛的表达, 不同的单元表示不同的状态和进程.
通过采用单元结构和滚动叙事, 可以将复杂的信息和故事分解为逻辑上相关的独立单元, 使读者逐步浏览和理解内容, 每个单元可以包含一个特定的主题、可视化手段或相关的文本描述, 以便读者逐步探索和消化信息.

○ 模型训练

为使模型有更快的收敛速度, 采用迁移学习的思想, 载入Pytorch官方EfficientNetV2_M的预训练权重作为模型的初始化权重, 训练50个epoch后模型基本收敛, Loss不再下降. 预测效果最佳的损失曲线以及评估指标mAP、召回率如图7所示.

图7  对不同缺陷目标检测的损失曲线及评价指标对比

在图7所示的召回率曲线中, 只有开路与短路的召回率没有达到100%存在漏检现象, 如图8所示.

图8  PCB漏检图
○ 不同模块性能对比

为了更好地评估本文改进的缺陷检测算法对于PCB缺陷目标的检测性能, 对本文所提出的模块进行消融实验, 结果如表3所示.


○ 不同骨干网络性能对比

在相同的实验条件下, 选取不同的经典骨干网络进行对比, 其mAP与FPS如表4所示. 与其他骨干网络相比, 本文使用EfficientNetV2_M骨干网络提取特征, 模型的检测精度更高, 效果更好.

○ EFPN中不同层融合结果对比

在EFPN中, 融合不同特征层会导致不同的检测效果. 为了更深入地评估参与特征融合的各特征层的准确性, 本文在保持其他网络结构不变的情况下进行了对比实验. 选择不同的特征层组合进行融合, 实验结果如表5所示.

○ 相同缺陷场景不同检测方法对比

为了验证改进后的Faster R-CNN在PCB检测算法中的性能, 在相同数据集下与其他的PCB检测算法进行实验对比, 所得数据如表6所示. 本文算法具有较高的检测精度, 并且满足实时检测需求, 其性能优于其他网络.

○ 检测结果对比

从未参与训练的原始数据集中随机挑选PCB缺陷图, 在相同环境下分别使用改进后的Faster R-CNN和以VGG16为骨干网络的原始Faster R-CNN对缺陷图进行检测, 其对比结果如图9所示. 本文算法检测精度更高, 在工业生产缺陷检测中能达到更好的检测效果.

图9  不同网络对PCB检测结果对比图


结  语

本文提出了一种基于EfficientNetV2与EFPN的Faster R-CNN目标检测算法, 用于PCB缺陷目标检测研究中. 经实验数据评估及检测结果表明, 与原Faster R-CNN、级联FasterRCNN、YOLOv7与LWN-Net等目前主流的PCB缺陷检测算法相比, 本文算法在检测精度上均有提升. 在检测时间方面, 虽然本文的检测速度相对较低, FPS仅为15.48帧/s, 但可满足实时检测需求, 能够适应实际工业生产中PCB缺陷目标的高效精准检测任务. 下一步工作要进一步研究提高模型算法效率, 期望能够在提高模型检测速度同时提高检测精度, 解决短路与开路的漏检问题.




尹嘉超(1998—), 男, 硕士研究生, 主要研究方向为图像处理、深度学习.

吕耀文(1987—), 男, 博士, 副教授, 硕士生导师, 论文通信作者, 主要研究方向为光电检测与图像处理.

索   科(1999—), 男, 硕士研究生, 主要研究方向为图像处理.

黄   玺(1998—), 男, 硕士研究生, 主要研究方向为图像处理、深度学习. 



— END —

还没关注?点击下方“卡片”关注,获取第一时间资讯

综述推荐      


综述推荐 | 基于叙事结构抽象的可视分析方法综述

综述推荐 | 监控场景下基于单帧与视频数据的行人属性识别方法综述及展望

综述推荐 | 面向超级计算机系统的可视化综述

综述推荐 | 数字图像多功能水印综述

综述推荐 | 基于RGB图像的三维人手姿态估计技术综述

综述推荐 | 数字图像多功能水印综述

综述推荐 | 基于条件生成对抗网络的图像翻译综述

综述推荐 | 基于单目RGB数据的三维模板物体跟踪算法综述

综述推荐 | 基于可视分析的训练数据质量提升综述

综述推荐|数字说话人视频生成综述

综述推荐 | 基于骨架的人体动作识别技术研究进展

综述推荐 | 面向计算机程序的可视化综述


合辑荐读      


合辑荐读 | 计算机技术与传统文化论文合辑

合辑荐读 | 几何建模与优化最新论文合辑

合辑荐读 | 目标检测、目标跟踪与重识别最新论文合辑

合辑荐读 | 医学图像处理最新论文合辑

合辑荐读 | 感知与交互最新论文合辑

合辑荐读 | VR/AR/MR最新论文合辑

合辑荐读 | 三维图形计算最新论文合辑

合辑荐读 | 可视化与可视分析最新论文合辑

合辑荐读 | 《计算机辅助设计与图形学学报》最新综述论文


整期论文速览


2024年第4期论文速览

2024年第3期论文速览

2024年第2期论文速览

2024年第1期论文速览

2023年第12期-CAD几何引擎架构及算法专刊论文速览

2023年第11期论文速览

2023年第10期论文速览

2023年第9期论文速览

2023年第8期论文速览

2023年第7期论文速览

2023年第6期论文速览

2023年第5期论文速览



声明

本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。




计算机辅助设计与图形学学报
《计算机辅助设计与图形学学报》官方平台。本刊创刊于1989年,EI、Scopus、北大核心、CSCD、CSTPCD、CNKI等国内外数据库收录,CCF推荐中文科技期刊A类、计算领域高质量科技期刊T1类。期刊官网:www.jcad.cn。
 最新文章