PaddleX上线小目标检测模型产线，支持遥感分析、智能监控、智慧交通等领域高效应用

科技 2024-12-12 20:04 北京

背景介绍

小目标检测通常指的是在图像或视频中精确地检测和定位尺寸较小、面积较小的目标物体，这些目标在图像中的像素尺寸通常较小，可能小于32像素×32像素（根据MS COCO等数据集的定义），且可能被背景或其他物体所掩盖，难以被肉眼直接观察出来。在许多应用场景中，小目标的检测都至关重要。例如，在遥感图像中检测小型车辆或建筑，可以帮助城市规划和交通管理；在自动驾驶中，检测远处的小型障碍物可以提高行车安全；在医学图像中，检测微小病灶能够辅助医生进行早期诊断。传统的目标检测算法可能因小目标的低像素密度而出现检测不准或漏检的情况，因此，专门的小目标检测算法应运而生，小目标检测可以有效提升对小物体的识别能力，确保在实际应用中不遗漏重要信息。这项技术在提高安全性和自动化水平方面发挥着重要作用。

PaddleX小目标检测产线是专注于解决小目标定位和识别任务的端到端模型产线，可以从图像中快速准确地定位小目标位置并识别小目标类型，可以快速支持如遥感分析，城市交通监控图像分析等垂类场景的高效应用。

算法解读：PP-YOLOE+ SOD

PP-YOLOE-SOD 是飞桨团队自研的小目标检测特色模型，使用数据集分布相关的基于向量的DFL算法 和 针对小目标优化的中心先验优化策略，并且在模型的Neck(FPN)结构中加入Transformer模块，以及结合增加P2层、使用large size等策略，最终在多个小目标数据集上达到极高的精度。

小目标检测（SOD）效果图

· 整体模型结构解读

PP-YOLOE-SOD基于PP-YOLOE优化，模型结构方面，同时考虑到推理耗时和精度问题，在PP-YOLOE的基础上在Neck中引入的Transformer encoder模块，整体结构如下图所示：

PP-YOLOE-SOD 模型结构示意图

· 针对小目标任务的训练优化

针对小目标任务专门设计的正样本挖掘机制

在YOLO系列的anchor-free模型预测范式下，原始的DFL回归算法要求预测点在GT Box的内部，并且回归头只能预测非负值。然而，在SOD场景下，由于预测点的稀疏性，在原始DFL匹配策略下，不能保证每个GT Box都能匹配上正样本，由此造成小目标召回较低。针对这个问题，PaddleDetection团队重新设计了针对SOD的DFL回归算法，核心变化有两点：允许回归头在预测时去预测负值，并且对于GT Box在匹配正样本时，不要求预测点一定在GT Box内部，而是在GT Box中心一定范围（center radius）即可，如上图c所示。同时，对于DFL中超参数reg_max的设置，飞桨团队也提出了一种基于数据集GT Box分布设置的方法，从而避免在训练时引入过多的噪音。

· PaddleX当前支持的小目标检测模型

以下列出来PaddleX当前支持的小目标检测模型列表，各个模型的性能指标如下：

注：以上精度指标为 VisDrone-DET 验证集 mAP(0.5:0.95)。所有模型 GPU 推理耗时基于 NVIDIA Tesla T4 机器，精度类型为 FP32， CPU 推理速度基于 Intel(R) Xeon(R) Gold 5117 CPU @ 2.00GHz，线程数为8，精度类型为 FP32。

使用方法

安装

· 安装PaddlePaddle

# cpupython -m pip install paddlepaddle==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
# gpu，该命令仅适用于 CUDA 版本为 11.8 的机器环境python -m pip install paddlepaddle-gpu==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
# gpu，该命令仅适用于 CUDA 版本为 12.3 的机器环境python -m pip install paddlepaddle-gpu==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cu123/

· 安装PaddleX Wheel包

pip install https://paddle-model-ecology.bj.bcebos.com/paddlex/whl/paddlex-3.0.0b2-py3-none-any.whl

快速体验

PaddleX 提供了简单易用的 Python API，只需几行代码即可体验端到端预测效果，可以下载测试图片，方便大家快速体验效果：

https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/small_object_detection.jpg

from paddlex import create_pipeline
pipeline = create_pipeline(pipeline="small_object_detection")
output = pipeline.predict("small_object_detection.jpg")for res in output:    res.print() ## 打印预测的结构化输出    res.save_to_img("./output/") ## 保存结果可视化图像    res.save_to_json("./output/") ## 保存预测的结构化输出

上述代码中：

首先使用产线名称调用create_pipeline()方法实例化产线对象；
然后使用predict()方法进行预测，对于预测结果支持print()方法进行打印，save_to_img()方法进行可视化并保存为图片以及save_to_json()方法保存预测的结构化输出。

下图为左为测试图像，右为放大的检测结果。可以看到，PP-YOLOE+ SOD 模型检出了其中的小目标。

原图

PP-YOLOE+ SOD效果图

二次开发

如果对产线的预训练模型效果满意，可以直接对产线进行高性能推理/服务化部署/端侧部署，如果不满意，您也可以使用 PaddleX 进行便捷高效的二次开发，使用自己场景的数据对模型微调训练获得更优的精度。

基于 PaddleX 便捷的二次开发能力，使用统一命令即可完成数据校验、模型训练与评估推理，无需了解深度学习的底层原理，按要求准备好场景数据，简单运行命令即可完成模型迭代，此处展示小目标检测模型二次开发流程：

python main.py -c paddlex/configs/small_object_detection/PP-YOLOE_plus_SOD-S.yaml \    -o Global.mode=train \    -o Global.dataset_dir=./dataset/small_det_examples

上述命令中：main.py 为模型开发统一入口文件；-c 用于指定模型配置文件的参数，模型配置文件 PP-YOLOE_plus_SOD-S.yaml 中包含了模型的信息，如模型名、学习率、批次大小等，其中 mode 支持指定数据校验（dataset_check）、训练（train）、评估（evaluate）和模型导出（export）。

更多参数也可以继续在命令中追加参数设置：如指定前 2 卡 gpu 训练：-o Global.device=gpu:0,1；设置训练轮次数为 10：-o Train.epochs_iters=10。此外，相关参数均可通过修改.yaml配置文件中的Global和Train的具体字段来进行设置。

其余更详细的使用方法及产线部署、自定义数据集相关的内容，请参考PaddleX官方教程文档：

小目标检测产线使用教程

https://paddlepaddle.github.io/PaddleX/latest/pipeline_usage/tutorials/cv_pipelines/small_object_detection.html

小目标检测模块使用教程

https://paddlepaddle.github.io/PaddleX/latest/module_usage/tutorials/cv_modules/small_object_detection.html

精彩课程预告

为了帮助您迅速且深入地了解小目标检测全流程解决方案，百度研发工程师将于 12月19日（周四）19：00 为您深度解析本次技术升级。此外，我们还将开设针对小目标检测产线的产业场景实战营，手把手带您体验从数据准备、数据校验、模型训练、性能优化到模型部署的完整开发流程。机会难得，立即扫描下方二维码预约吧！

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

飞桨PaddlePaddle

源于产业实践的开源深度学习平台

最新文章

飞桨PP系列模型上新！PP-DocBee文档图像理解的新‘蜂’向标！

盘点2024：这一年，我们这样走过

效率提升300%！文心一言与辞海强强结合，推出智能知识审校系统“辞文”

正在报名！文心中国行走进武汉，共探大模型时代产业新机遇

“智惠万企—文心赋能中小企业专项行动计划”正式发布并启动招募

百度AICA第八期正式收官 79名首席“AI架构师”毕业执桨起航

百度与南京市鼓楼区共建江苏首个飞桨人工智能产业赋能中心

文心中国行再聚鹭岛！厦门飞桨赋能中心启航

大模型助力教师提效创新：百名教师齐聚百度飞桨（厦门）人工智能产业赋能中心！

飞桨扬帆智海，大湾区杯AI For Science科技竞赛圆满完赛

大模型区域落地再加速！“文心中国行”走进广州

大模型技术沙龙：行业深度融合与创新路径探索

大学生做得好不好小学生来pick，2024 C4-AI总决赛在中华世纪坛圆满落幕

飞桨大模型Unified Checkpoint技术加速模型存储95%，节省空间78.5%

一亿中流加入飞桨技术伙伴计划，“AI+营销”实现智能化精准拓客

飞桨AI for Science课程表｜前沿讲座系列课程预告（三）

PaddleX上线小目标检测模型产线，支持遥感分析、智能监控、智慧交通等领域高效应用

飞桨教师风采｜李彝利：基于飞桨的校企协同AI创新人才培养模式探索

下一站，广州！12月19日文心中国行与您共建大模型产业应用生态圈

飞桨星河社区六周年｜学练进阶·技术畅谈，一起并肩前行

第六届CECC大会圆满落幕，大模型技术引领教育改革与创新

学校新来了一位AI作文老师：能看、会评、还教改写

飞桨出海助力智利企业Simon9精准解决包装行业质检难题，生产损失降低90%

第六届CECC中国计算机教育大会百度“大模型技术创新与教育实践”论坛来啦

飞桨AI for Science课程表｜前沿讲座系列课程预告（二）

PaddleX 上线多标签分类模型产线，高效支持图像识别、智能监控、工业质检等领域应用

FlashRAG-Paddle | 基于PaddleNLP的高效开发与评测RAG框架

重磅！飞桨开源社区携手百度开源办公室，为开源贡献者送福利！

“未来之后”AI4S第三届国际高峰论坛报名｜诺贝尔奖得主、五位院士、顶尖专家学者与企业领袖齐聚，分享前沿趋势及领域成果

飞桨PaddleScience与北大研究会开展科学计算训练营

百度飞桨联动香港教育大学AIREA，共话AI+教育发展新趋势

PaddleX 上线人脸定位与识别端到端模型产线，为安全监控、身份认证、智能家居等领域保驾护航

大模型时代下的高等教育转型——百度领航AI通识课程建设

「体验官招募」多模态大模型开发套件PaddleMIX开发项目挑战

基于PP-ShiTuv2新增PaddleX图像识别模型产线，显著提升商品识别等细粒度开放域产业场景检索性能

一束电力智能之光，点亮“星河”应用创新未来

百度文心智能体技术获2024世界互联网大会领先科技奖

2024大湾区科学论坛举行，百度吴甜解读大模型如何重塑产业智能引擎

官方带队实测，阶梯式解锁飞桨框架3.0能力新特性，轻松上手！

飞桨AI for Science课程表｜前沿讲座系列课程预告

PaddleClas 2.6 发布，新增细粒度商品识别、特色多标签分类等前沿算法和检索能力！

AI少年科创营：学而思与百度飞桨携手开启青少年AI科普之旅

百度王海峰：文心一言用户规模达4.3亿

打造没有围墙的学校，百度世界2024发布科技馆智能体

文心iRAG和无代码“秒哒”发布！李彦宏：即将迎来AI应用的群星闪耀时刻

太好了支持多比例出图！新媒体人有救了！

飞桨PaddleScience亮相DACOMA-24，助力科学计算新探索

PaddleSeg发布图像异常检测高精度模型STFPM，无监督异常检测算法赋能产业升级

百度联合学界打造国内最新AI for Science系列课程

百度升级AI for Science共创计划，携手学者共研顶尖学术成果

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉