YOLO11新王登基!实战改进版,杀穿顶会!

文摘   2025-01-08 21:40   山东  

众所周知,YOLO一直是发论文的大热门!而YOLO11做为其的最新版本,必然会在2025成为各大顶会的“宠儿”!

主要在于:一方面,YOLO其他系列的改进早已卷成“红海”,而YOLO11提出才几个月,目前还比较新,可发挥空间很大。另一方面,其在不牺牲准确度的情况下,还具有更高的计算效率,尤其在资源受限的情况下,非常适用。但也面临模型复杂度高、依赖标注数据的质量和数量等问题。这便给我们论文创新提供了机会!

想往这方向发论文的伙伴,可以从这些方面入手:模型架构优化(像是引入注意力机制、多尺度特征融合;模型轻量化;与Transformer等技术结合)、与多模态融合结合、增强损失函数……

为让大家能够紧跟领域前沿,早点发出自己的顶会,每种思路我都给大家准备了参考论文,共11篇,可以无偿分享给你

扫描下方二维码,回复「YOLO11

免费获取全部论文合集及项目代码

引入注意力机制

LW-YOLO11: A Lightweight Arbitrary-Oriented Ship Detection Method Based on Improved YOLO11

内容:文章介绍了一种基于改进YOLO11的轻量级任意方向船舶检测方法,称为LW-YOLO11。该方法通过设计轻量级的多尺度特征扩张注意力模块和跨阶段部分阶段模块,提高了在遥感图像中对任意方向船舶的高精度检测能力。实验结果表明,该方法在HRSC2016和MMShip数据集上的检测性能优于现有的先进检测方法,具有轻量级结构和高准确率的特点。

引入多尺度特征融合

Cfmsa: A Cross-Feature Multiscale Spatial Attention Module for Elongated Chip Surface Defects

内容:文章介绍了一种名为Cfmsa的跨特征多尺度空间注意力模块,用于检测细长芯片表面的缺陷。该模块通过在不同尺度上捕捉特征之间的空间关系,提高了对芯片表面缺陷的检测精度,特别是在处理形状细长和复杂背景的缺陷时表现出色。

与Transformer结合

YOLO11 AND VISION TRANSFORMERS BASED 3D POSE  ESTIMATION OF IMMATURE GREEN FRUITS IN COMMERCIAL  APPLE ORCHARDS FOR ROBOTIC THINNING

内容:文章介绍了一种基于YOLO11和Vision Transformers的3D姿态估计方法,用于商业苹果园中未成熟青苹果的机器人疏果。研究比较了YOLO11和YOLOv8在检测和姿态估计方面的性能,并探讨了Dense Prediction Transformer和Depth Anything V2在RGB到RGB-D映射中的应用。结果显示,YOLO11n在精度和推理速度上表现最佳,而Depth Anything V2在3D姿态长度验证中误差最小。

扫描下方二维码,回复「YOLO11

免费获取全部论文合集及项目代码

集成多模态数据

An Adaptive YOLO11 Framework for the Localisation, Tracking, and Imaging of Small Aerial Targets Using a Pan–Tilt–Zoom Camera Network

内容:文章介绍了一种基于YOLO11框架的自适应系统,用于使用云台变焦相机网络对小型空中目标进行定位、跟踪和成像。该系统结合了神经网络目标检测和立体视觉技术,能够实时区分和跟踪快速、不规则移动的小型空中目标。通过数据增强和模型优化,系统在实验中展示了较高的检测精度和跟踪稳定性,能够在15 FPS的速度下实现目标的稳定跟踪,准确率达到92.58%。

模型轻量化

YOLOv11 Optimization for Efficient Resource  Utilization

内容:文章研究了YOLOv11的优化,提出了六种针对不同尺寸目标的修改版本,通过剪枝不必要的层和重构主架构来提高计算资源的利用效率。这些修改版本在保持原始YOLOv11准确性的同时,显著降低了模型大小和推理时间,并在某些情况下提高了检测性能。文章还介绍了一个对象分类器程序,用于根据数据集特征选择最适合的修改版本。

扫描下方二维码,回复「YOLO11

免费获取全部论文合集及项目代码



AI科研技术派
专注于人工智能领域。每日更新AI技术干货、前沿资讯、算法知识、论文/比赛推荐、面试分享等行业资源。
 最新文章