利用先进技术保家卫国:深度学习进行小目标检测(适合初学者入门)

科技   2024-11-24 09:30   浙江  

关注并星标

从此不迷路

计算机视觉研究院


公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

论文地址:https://arxiv.org/pdf/2201.03243v1.pdf

计算机视觉研究院专栏

一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。
   整体的介绍都比较基础简单,初学者可以简单了解!

一、前言

如今,无人机等被广泛用于各种用途,例如从航空图像中捕获和目标检测等。这些小型ariel车辆轻松进入公众可能会造成严重的安全威胁。例如,关键地点可能会被混入公共场所的间谍使用无人机监控。

Study in hand提出了一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。所提出的系统由一个定制的深度学习模型“Tiny YOLOv3”组成,这是一种非常快速的目标检测模型“You Look Only Once”(YOLO)被构建并用于检测。目标检测算法将有效地检测无人机。与之前的YOLO版本相比,所提出的架构显示出明显更好的性能。在资源使用和时间复杂度方面得到了改进。

二、背景

随着世界在融合最新技术的同时不断进步,安全系统也在快速发展,以利用创新的力量来应对可能出现的任何安全威胁。在过去的几年里,无人机的使用量急剧增加,包括对公众的可及性,这进一步增加了其使用量。随着无人机使用量的增加,安全威胁也随之增加。我们已经看到了一些无人机飞越不同建筑物的事件,包括一些需要安全的敏感区域。

无人机还提出了许多威胁,包括无人机被用作毒品走私工具、入侵无人机导致它们爆炸或使用它们窃取敏感信息,无人机还被用于进行非法监视,造成安全和隐私威胁。这些事件对安全和隐私构成了巨大威胁。因此,解决这些安全问题的方法是检测和跟踪这些无人机,以便采取反制技术来阻止这些无人机,以确保安全和隐私。

此外,大多数安全或防御系统都具有检测可能发生的威胁程度的能力,但是,很少有人能够深入分析威胁。随着机器学习和人工智能的进步,通过减少人为干预使此类系统变得智能化,有效的目标检测可以帮助提高安全系统的效率并执行更好的分析。

三、新框架分析

前期主要介绍了深度学习的一些基础知识:

Image matrix convolution operation with multiplies filter matrix

Convolution with 3 x3 filter using Stride 2

ReLU operation

Max-Pooling

Fully Connected Layer

如上展示,尽管Tiny YOLOv3比YOLOv3快得多,但它因为它在2个尺度上执行检测,并没有提供更好的准确度。

为了更好地实现准确性,研究者引入了一个修改后的Tiny YOLOv3架构。该架构总共包括31层:16个卷积层,3个检测层,其余是用最大池化和ReLU层。以前的YOLOV3微型架构由总共24层组成,其中包括13个卷积层、3个检测层。

研究者修改了Tiny YOLOv3架构,通过使用前几层的ReLU层提取特征,将在三个尺度上进行检测。这意味着3个yolo层将负责检测对象。锚框用于计算预测边界框的宽度和高度。通常,YOLOv3为每个单元使用3个锚点,这些锚点预测三个边界框,总共9个锚点框。对于研究者的自定义目标检测器,总共使用了6个锚框。

预测特征图将分别为3个尺度上的13x13、26x26和52x52。随着网络向前传播图像,在第一个yolo层,得到一个13x13的输出特征图。在放置第一个yolo层之后,对下一层进行了两倍的采样,然后将具有相似大小的前一层的特征图连接起来。对于第二个yolo层,得到26x26的输出特征图,在第三个yolo层,得到一个52x52的特征图。这种架构比原始的yolov3架构更简洁、更小,后者在3个尺度上进行检测。此外,研究者的小而轻的架构可以检测具有高置信度分数的小物体。

四、实验

Results Evaluated

AVG FPS

© THE END 

转载请联系本公众号获得授权


计算机视觉研究院学习群等你加入!


ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


 往期推荐 

🔗

计算机视觉研究院
计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”!
 最新文章