利用先进技术保家卫国：深度学习进行小目标检测（适合初学者入门）

科技 2024-11-24 09:30 浙江

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

论文地址：https://arxiv.org/pdf/2201.03243v1.pdf

计算机视觉研究院专栏

一种改进且高效的基于深度学习的自主系统，该系统可以高精度地检测和跟踪非常小的无人机。
整体的介绍都比较基础简单，初学者可以简单了解！

一、前言

如今，无人机等被广泛用于各种用途，例如从航空图像中捕获和目标检测等。这些小型ariel车辆轻松进入公众可能会造成严重的安全威胁。例如，关键地点可能会被混入公共场所的间谍使用无人机监控。

Study in hand提出了一种改进且高效的基于深度学习的自主系统，该系统可以高精度地检测和跟踪非常小的无人机。所提出的系统由一个定制的深度学习模型“Tiny YOLOv3”组成，这是一种非常快速的目标检测模型“You Look Only Once”（YOLO）被构建并用于检测。目标检测算法将有效地检测无人机。与之前的YOLO版本相比，所提出的架构显示出明显更好的性能。在资源使用和时间复杂度方面得到了改进。

二、背景

随着世界在融合最新技术的同时不断进步，安全系统也在快速发展，以利用创新的力量来应对可能出现的任何安全威胁。在过去的几年里，无人机的使用量急剧增加，包括对公众的可及性，这进一步增加了其使用量。随着无人机使用量的增加，安全威胁也随之增加。我们已经看到了一些无人机飞越不同建筑物的事件，包括一些需要安全的敏感区域。

无人机还提出了许多威胁，包括无人机被用作毒品走私工具、入侵无人机导致它们爆炸或使用它们窃取敏感信息，无人机还被用于进行非法监视，造成安全和隐私威胁。这些事件对安全和隐私构成了巨大威胁。因此，解决这些安全问题的方法是检测和跟踪这些无人机，以便采取反制技术来阻止这些无人机，以确保安全和隐私。

此外，大多数安全或防御系统都具有检测可能发生的威胁程度的能力，但是，很少有人能够深入分析威胁。随着机器学习和人工智能的进步，通过减少人为干预使此类系统变得智能化，有效的目标检测可以帮助提高安全系统的效率并执行更好的分析。

三、新框架分析

前期主要介绍了深度学习的一些基础知识：

Image matrix convolution operation with multiplies filter matrix

Convolution with 3 x3 filter using Stride 2

ReLU operation

Max-Pooling

Fully Connected Layer

如上展示，尽管Tiny YOLOv3比YOLOv3快得多，但它因为它在2个尺度上执行检测，并没有提供更好的准确度。

为了更好地实现准确性，研究者引入了一个修改后的Tiny YOLOv3架构。该架构总共包括31层：16个卷积层，3个检测层，其余是用最大池化和ReLU层。以前的YOLOV3微型架构由总共24层组成，其中包括13个卷积层、3个检测层。

研究者修改了Tiny YOLOv3架构，通过使用前几层的ReLU层提取特征，将在三个尺度上进行检测。这意味着3个yolo层将负责检测对象。锚框用于计算预测边界框的宽度和高度。通常，YOLOv3为每个单元使用3个锚点，这些锚点预测三个边界框，总共9个锚点框。对于研究者的自定义目标检测器，总共使用了6个锚框。

预测特征图将分别为3个尺度上的13x13、26x26和52x52。随着网络向前传播图像，在第一个yolo层，得到一个13x13的输出特征图。在放置第一个yolo层之后，对下一层进行了两倍的采样，然后将具有相似大小的前一层的特征图连接起来。对于第二个yolo层，得到26x26的输出特征图，在第三个yolo层，得到一个52x52的特征图。这种架构比原始的yolov3架构更简洁、更小，后者在3个尺度上进行检测。此外，研究者的小而轻的架构可以检测具有高置信度分数的小物体。

四、实验

Results Evaluated

AVG FPS

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗

计算机视觉研究院

计算机视觉研究院主要涉及AI研究和落地实践，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”！

最新文章

从源头消除大模型“幻觉”，性价比吊打传统微调方法

Fast YOLO：用于实时嵌入式目标检测（附论文下载）

旋转角度目标检测的重要性！！！（附源论文下载）

YOLO-S：小目标检测的轻量级、精确的类YOLO网络

最后征稿+连续8届检索 | 第九届控制工程与人工智能国际会议(CCEAI 2025)会议地点已定！

智慧建筑：基于YOLOv7的建筑外墙缺陷检测

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

欢迎加入“计算机视觉研究院”学习群

年薪百万or惨遭裁员，AIGC开发者如何破局？

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、近零开销

2024全球无人机市场洞察报告

粉丝福利！免费赠书中奖名单

凭什么YOLO是最强目标检测器，一文读懂！

大改Yolo框架 | 能源消耗极低的目标检测新框架（附论文下载）

智能体零样本解决未见过人类设计环境！全靠这个开放式物理RL环境空间

史上最通俗易懂的YOLO系列（v1-v10）模型解读！

更快、更灵活的Transformer图像去雾网络

“计算机视觉研究院”商务合作

利用先进技术保家卫国：深度学习进行小目标检测（适合初学者入门）

机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

2024新技术：远距离的小目标也可以准确检测

大改Yolo框架 | 能源消耗极低的目标检测新框架（附论文下载）

“计算机视觉研究院”商务合作

RestoreDet：低分辨率图像中目标检测

GPT理解的CV：基于Yolov5的半监督目标检测

机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

“计算机视觉研究院”商务合作

送书福利《计算机视觉之PyTorch数字图像处理》等你来拿！！！

YOLO-SLD：一种改进的注意机制YOLO车牌检测

多尺度特征融合：为检测学习更好的语义信息（附论文下载）

“计算机视觉研究院”商务合作

YOLO跌落神坛？新一代目标检测器又有新突破！

乌镇“网”事：看这道“光”！站在小镇望世界

欢迎加入“计算机视觉研究院”学习群

快速学会AI核心架构，Transformer！

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

免费分享顶会的idea方法！！！

无卷积骨干网络：金字塔Transformer，提升目标检测/分割等任务精度（附源代码）

我用捡来的idea发了顶会！！！

揭示Transformer重要缺陷！北大提出傅里叶分析神经网络FAN，填补周期性特征建模缺陷

YoloV：视频中目标实时检测依然很棒（附源代码下载）

ICLR'25审稿质量历史最低？这么多全负正常么

NeurIPS 2024 | 无需训练，一个框架搞定开放式目标检测、实例分割

“计算机视觉研究院”商务合作

Yolo-Z：改进的YOLOv5用于小目标检测（附原论文下载）

多尺度特征融合：为检测学习更好的语义信息（附论文下载）

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

“计算机视觉研究院”商务合作

喜提 TPAMI 顶刊！！！

Token化一切，甚至网络！北大&谷歌&马普所提出TokenFormer，Transformer从来没有这么灵活过！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉