点击蓝字
关注我们
关注并星标
从此不迷路
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10571945
计算机视觉研究院专栏
Column of Computer Vision Institute
车辆牌照检测在智能交通系统中起着关键作用。检测汽车、卡车和货车等车牌对于执法、监控和收费站运营非常有用。
PART/1
概述
因此,提出了一种改进的YOLOv7,集成了用于车牌检测的无参数注意力模块SimAM,即YOLO-SLD。在不修改YOLOv7的关键组件原始ELAN架构的情况下,在ELAN的末尾添加了SimAM机制,以更好地提取车牌特征并提高计算效率。更重要的是,SimAM模块不需要向原始YOLOv7网络添加任何参数,从而减少了模型计算,简化了计算过程。首次在CCPD数据集上测试了具有不同注意机制的检测模型的性能,证明了所提出的方法是有效的。实验结果表明,YOLO-SLD模型具有更高的检测精度,并且在mAP为0.5时更轻,整体准确率从原始YOLOv7模型的98.44%提高到98.91%,准确率提高了0.47%。CCPD测试子集在暗图像和亮图像中的准确率从93.5%提高到96.7%,准确率提高了3.2%。与原始YOLOv7模型相比,模型的参数大小减少了120万个参数。其性能优于其他流行的车牌检测算法。
PART/2
背景
PART/3
新技术分析
SimAM
改进的YOLOv7网络架构
基于传统图像识别技术和深度学习对象检测技术的优点,将改进的SimAM嵌入到YOLOv7模型中。这种集成旨在改进其网络架构,提高车牌检测的识别精度。所提出方法的具体流程如下图所示:
1) 骨干网络的改进
在特征提取中,骨干网起着至关重要的作用。原始的YOLOv7架构具有一个由50个模块组成的骨干网络,包括CBS模块、MaxPooling(MP)模块、ELAN和ELAN-H模块。ELAN和ELAN-H模块是YOLOv7的关键组件,旨在提高网络性能和效率。ELAN模块聚合了多层特征,以有效地合并来自不同层次的信息,并利用跳跃连接和多层融合来减少深度网络中梯度消失的常见问题。在ELAN的基础上,E-ELAN进一步增强了特征聚合能力,采用了更有效的层聚合策略来降低计算复杂度,并使用扩展的层聚合技术来提取更丰富的特征。SimAM注意力机制具有3D权重,该权重是在ELAN和E-ELAN的特征提取能力和计算效率之后添加的,可以更好地细化提取的车牌特征,并且可以在光照条件复杂的情况下自适应地强调车牌的目标特征并抑制不相关的背景特征,而不会增加模型的复杂性。与原有骨干网相比,本文提出的改进是在骨干网中的ELAN模块和ELAN-H模块中添加SimAM,并引入SimAM注意机制,形成新的SimAM ELAN和SimAM-ELAN-H模型,如下图所示。
2) 改善颈部和头部皮肤
传统的ELAN模块是一个高效的远程网络,能够通过移位卷积有效地提取局部图像结构。它通过共享注意力机制实现了模型推理时间的减少。此外,还引入了SimAM模块来处理原始图像。通过整合SimAM空间和通道注意力机制,可以有效地解决这个问题,从而同时形成完善的神经科学理论。Liang等人在2021年提出了SimAM,这是一种完全三维、加权和无参数的注意力机制。与其他现有的注意力机制相比,SimAM考虑了空间和通道因素之间的相关性,可以有效地生成逼真的三维权重,以提高模型的收敛性能。SimAM的注意机制通过评估神经元的重要性来提高模型的注意能力,其中具有空间抑制效应的神经元被认为更有价值。我们网络的主要结构如下图所示。对原始网络结构的显著增强包括在头部SPPCSPC模块之后加入SimAM注意力模块。
PART/4
实验及可视化
END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
往期推荐
🔗