关注并星标
从此不迷路
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
论文地址:https://arxiv.org/pdf/1904.06883.pdf
计算机视觉研究院专栏
Dubox增强了启发式引导的能力,进一步使第一尺度探测器能够最大限度地检测小目标,第二尺度探测器能够检测第一尺度探测器无法识别的目标。今天给大家分享的文章可能会优点旧,但是我觉得整体是一个不错的ideal!
现实世界中的图像包含不同比例的对象。尺度变化已成为目标检测领域的一个具有挑战性的问题。为了实现尺度不变性,最先进的方法通常结合多个层次的特征来构建特征金字塔或多层特征塔。同时,为了提高检测性能,多尺度方法在不同尺度上并行使用多个检测器。例如,RetinaNet有五个尺度检测器(p3-p7),它们在特征金字塔结构上并行检测。YOLOv5在主网上运行了三个检测器。
此外,prior box被认为是处理尺度不变性的有效手段。它是许多检测器的基础,例如Faster RCNN和YOLOv2中的锚点,SSD中的默认框。先验框是一堆具有预定义大小和纵横比的框,它们以滑动窗口的方式平铺特征图,作为检测候选。先验框离散化可能的输出边界框形状的空间,DNN基于特定的先验框利用先验信息对边界框进行回归。多尺度检测和先验框的混合是最先进的检测器中的常见做法,它利用了多尺度特征和预先计算的边界框统计数据。
二、前言
传统的目标检测方法使用多尺度特征,允许多个检测器独立并行地执行检测任务。同时,通过对prior box的处理,增强了算法处理尺度不变性的能力。然而,太多的先验框和独立的检测器会增加检测算法的计算冗余。
Some comparisons with the precision and speed to clas- sical algorithms on VOC07, ▽ is two-stage method, ⃝ denote the one-stage algorithm, □is Dubox.
今天这项研究中,研究者介绍了Dubox,这是一种新的单阶段方法,可以在没有先验框的情况下检测目标。使用多尺度特征,设计的双尺度残差单元使双尺度检测器不再独立运行。第二个尺度检测器学习第一个的残差。Dubox增强了启发式引导的能力,可以进一步使第一尺度检测器能够最大限度地检测小目标,第二尺度检测器能够检测第一个无法识别的对象。此外,对于每个尺度检测器,新的classification-regression progressive strap loss(CRPS)使整个的过程不再基于先验框。整合这些策略,新提出的检测算法在速度和准确性方面取得了出色的表现。在VOC、COCO目标检测基准上的大量实验证实了该算法的有效性。
三、新框架
双尺度的冗余策略:
Differentiate positive range:设计检测器1中的p为10,检测器2中的p为9。同时,向检测器1的正范围添加一个约束 => r=arg min(r, 3)。该方法确保了大目标正样本挂钩的数量受到限制,并且提高了低级别检测小目标的性能。
Differentiate scale weight:物体的目标边界框在原始图像中占据的区域大于0.3,则检测器1的回归将忽略该目标对象。(让大目标给检测器2来检测,检测器1只负责检测小目标)
Bbox Bridge Module
Bbox(边界框)桥模块将低级检测器和高级检测器的回归连接起来,从而使高级别回归基于低级残差。
基于这一观察,研究者通过IoU重建classification loss progressive strap :
四、实验
Comparison with state-of-the-art detectors on MS COCO test-dev
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
🔗
Fast YOLO:用于实时嵌入式目标检测(附论文下载) Micro-YOLO:探索目标检测压缩模型的有效方法(附论文下载) 目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载) 多尺度深度特征(下):多尺度特征学习才是目标检测精髓(论文免费下载) 多尺度深度特征(上):多尺度特征学习才是目标检测精髓(干货满满,建议收藏) ICCV2021目标检测:用图特征金字塔提升精度(附论文下载) CVPR21小样本检测:蒸馏&上下文助力小样本检测(代码已开源) 半监督辅助目标检测:自训练+数据增强提升精度(附源码下载) 目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载) 目标检测新框架CBNet | 多Backbone网络结构用于目标检测(附源码下载) CVPR21最佳检测:不再是方方正正的目标检测输出(附源码) Sparse R-CNN:稀疏框架,端到端的目标检测(附源码)