Ultralytics 近日发布了 YOLOv11,这是其 YOLO 系列目标检测模型的最新版本。YOLOv11 在架构和训练方法上进行了重大改进,旨在提供更精确、更快速和更高效的物体检测能力。
主要更新
增强型特征提取:YOLOv11 采用改进的骨干和颈部架构,增强了特征提取能力,从而实现更精确的目标检测和复杂任务性能。 优化效率和速度:YOLOv11 引入了完善的架构设计和优化的训练管道,提供更快的处理速度,并在准确性和性能之间保持最佳平衡。 参数更少,精度更高:YOLOv11m 在 COCO 数据集上实现了更高的平均精度(mAP),同时使用的参数比 YOLOv8m 减少了 22%,从而在不影响精度的情况下提高了计算效率。 跨环境适应性:YOLOv11 可在各种环境中无缝部署,包括边缘设备、云平台和支持 NVIDIA GPU 的系统,确保最大的灵活性。 支持的任务范围广泛:无论是对象检测、实例分割、图像分类、姿态估计,还是面向对象检测 (OBB),YOLOv11 都能应对各种计算机视觉挑战。
YOLOv11 的主要架构改进包括:
主干网络(Backbone):引入了 C2PSA 组件,并将 C2f 升级为 C3k2 。C3k 允许用户自定义卷积模块的尺寸,提升了灵活性。C2PSA 通过整合 PSA(位置敏感注意力机制)来增强模型的特征提取效能。 颈部网络(Neck):采用了 PAN(Path Aggregation Network)架构,并在其中集成了 C3K2 单元,有助于从多个尺度整合特征,并优化特征传递的效率。 头部网络(Head):YOLOv11 的检测头设计与 YOLOV8 大致相似,但在 YOLO11 的分类(cls)分支中,采用了深度可分离卷积来增强性能。
YOLOv11 的这些改进使其成为各种计算机视觉应用的理想选择,包括:
实时目标检测:在移动设备、无人机和机器人等边缘设备上进行实时目标检测。 图像分割:在医疗影像分析、自动驾驶和图像编辑等领域进行精确的图像分割。 姿态估计:在运动分析、人机交互和虚拟现实等领域进行准确的姿态估计。
Ultralytics 团队表示:“YOLOv11 的发布标志着 YOLO 系列模型在性能和效率方面迈出了重要的一步。我们相信,YOLOv11 将成为各种计算机视觉应用的强大工具。”
参考:https://docs.ultralytics.com/models/yolo11