如何评价Ultralytics出的YOLOv11？

科技 2024-10-29 10:05 中国香港

点击下方“深度学习爱好者”，选择加"星标"或“置顶”

链接：https://www.zhihu.com/question/694696741?utm_psn=1833942257365020675
编辑：深度学习与计算机视觉
声明：仅做学术分享，侵删

Ultralytics出了最新的YOLOv11，官方给出的速度、精度指标也都比YOLOv8要高，如何评价YOLOv11？实际效果如何？

作者：MoonCancer

https://www.zhihu.com/question/694696741/answer/3984007543?utm_psn=1833950673340882945

形象的体现了某个task卷无可卷之后会发展成什么样

作者：Rocky Ding

https://www.zhihu.com/question/694696741/answer/3998991306?utm_psn=1833949765836075008

YOLOv11的发布，预示着传统深度学习时代的彻底落幕。

YOLO系列从传统深度学习巅峰时期的技术推动力量，逐渐转变成传统深度学习各方势力收益的获取工具。

作者：圈圈虫

https://www.zhihu.com/question/694696741/answer/3861567276?utm_psn=1833942735385661441

Ultralytics 的上一个官方版本是 2023年1月发布的 YOLOv8 系列，已经过去了1年多了。那么 YOLO11 作为最新官方版本都有哪些更新呢？

强化特征提取：YOLO11 采用了改进的后端和颈部架构，增强了特征提取能力，从而实现更精确的物体检测和更复杂的任务执行；

2 优化效率与速度：YOLO11 引入了经过改进的架构设计和优化的训练流程，实现了更快的处理速度，并保持了准确性和性能之间的最佳平衡；

3 更精准、更少参数：随着模型设计的进步，YOLO11m 在 COCO 数据集上的平均精确度（mAP）更高，同时使用了比 YOLOv8m 少 22% 的参数，在不牺牲精度的情况下提高了计算效率；

4 跨环境适应性：YOLO11 可以在各种环境中无缝部署，包括边缘设备、云平台以及支持 NVIDIA GPU 的系统，确保最大限度的灵活性（这句话非常认可，因为在 AX650N 上直接用 YOLOv8 的 sample 就能运行）；

5 YOLO11 支持多种任务：无论是目标检测、实例分割、图像分类、姿态估计还是定向对象检测（OBB），YOLO11 的设计旨在满足各种计算机视觉挑战。（本文只介绍目标检测任务的部署）

新增了 C2PSA 模块用于特征增强，其实就是一个小的 Self-Attention

作者：Onedroid

https://www.zhihu.com/question/694696741/answer/3863995333?utm_psn=1833945921450299392

1 修复了yolov8 c2f最后一个卷积前既有concat,又有residual 的冗余问题. 具体看这个issue github.com/ultralytics/..., 官方采用的是抛弃concat，保留residual的操作，调整架构再训练，确实更有性价比。为什么c2f的设计不合理，有兴趣可以参考这个文章 Onedroid：YoloV8 C2f模块冗余残差问题

2 bottleneck变成真正的bottleneck了，中间层通道冗余有所缓解，类似LoRA的情况。不过实现仍然很奇葩，既不是resnetv1,也不是resnetv2的模块。

qwq 今天师兄跟我说，公司里面已经把sp+sg做到在手机上能跑60帧了。。。我现在感觉可能传统方法能保留的领地真的越来越少了。

3 模块第一个1x1卷积分成两个1x1 卷积，而不是一个卷积后再split，可以和torch-pruning工具无缝衔接了。Torch-Pruning/examples/yolov8 at master · VainF/Torch-Pruning，链接里(https://github.com/VainF/Torch-Pruning/tree/master/examples/yolov8)为了容易剪枝也是这么实现的，分成两个卷积在一些硬件上确实能更快。如果不需要用torch-pruning继续剪枝，建议两种实现方法都用用看，测试在部署硬件上哪个更快。毕竟部署还要量化，数据量被缩放了，在加上硬件读写和计算能力对这两种实现都会有影响，实测优先，毕竟不同的平台，硬件参数不同。之前在剪yolov8n的时候懒得转换回去，保留两个卷积的实现方式，发现更快了，量化后也更快。这其实也提供了一个实用的加速思路,分块不一定是两个，每一层情况都不一样，有的层可能无法加速。测试每一层的最优分块数，可能会有加速的空间

模块设计正常多了，效果和速度提升应该不假。

补充一下， Torch-Pruning/examples/yolov8 at master · VainF/Torch-Pruning, 这个(https://github.com/VainF/Torch-Pruning/tree/master/examples/yolov8)prune yolov8的代码文件只是保证能用这个工具合法剪枝，并不保证效果，还得自己改代码（选择哪些层需要修剪，选什么剪枝算法）。如果效果不太好，建议保留前几层和检测头且冻结参数，即保留网络首尾，只裁剪和训练网络中间部分。

下载1：Pytoch常用函数手册

在「深度学习爱好者」公众号后台回复：Pytorch常用函数手册，即可下载全网第一份Pytorch常用函数手册，涵盖Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多线程处理等十四章章内容。

下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

http://mp.weixin.qq.com/s?__biz=MzU1OTYzNjg5OQ==&mid=2247569359&idx=1&sn=19a37f1c9e41f02043313135e9ac679f

深度学习爱好者

分享机器学习、深度学习和Python等知识与原理，每天分享深度学习与计算机视觉领域的经典和最新的论文总结，带读者一起跟踪前言科技！

最新文章

EMF-former：一种用于图像分割的高效且内存友好的Transformer

使用PyTorch从头开始构建CLIP | 对比语言图像预训练

详细记录u版YOLOv5目标检测NCNN实现

导师：自己每天科研工作近10小时，都觉得不够。研究生们，每天工作不够5小时，拿什么去竞争？

像堆乐高一样：从零开始解释神经网络的数学过程

特征选择：11 种特征选择策略总结！

YOLO 系列目标检测大合集

Swin-UMamba：基于ImageNet的预训练的基于Mamba的UNet网络

项目案例：基于 YOLO 的铝型材表面缺陷识别

Batch Normalization原理与实战

Jupyter Notebook 五大效率插件