二区及以上:YOLO依然是香饽饽!把准6大创新套路,你上你也行!

文摘   2024-12-10 21:40   山东  

别说YOLO卷不动了!魔改一波照样发高区!光是ECCV24就有好几篇,模型SpikeYOLO更是拿到了满分!

而且大家去搜就会发现,这几年不管是各区期刊,还是各类顶会,YOLO都是常客,只要你用点心,靠他毕业根本不在话下!

主要在于:一方面,它简单好上手,且积累了丰富的公开代码等资源,我们拿过来就好改;另一方面,它应用非常广泛,结合新的数据集和应用场景,便是新的可能!此外,近来不少新技术,也给我们找创新提供了机会。比如通过与Mamba结合,模型MambaYOLO便在参数减少47.2%的同时,精度还比YOLOv8-s高6.1%!

想发论文的伙伴,可以从模型架构优化、损失函数优化、数据增强、模型训练策略优化、结合多模态融合等入手。为方便大家研究的进行,每种方法,我都给大家准备了参考论文和源码,共35篇

扫描下方二维码,回复「35yolo

免费获取全部论文合集及项目代码

模型架构优化

主要有:更换卷积和block结构、更换backbone和head、引入注意力机制、引入多尺度特征融合、模型轻量化、与其他新技术结合等

TD-YOLO: Taylor-Attention based Dehazing for Enhanced YOLO  Detection Performance

内容:文章介绍了一个名为TD-YOLO的新型框架,它利用基于Taylor-Attention的去雾技术来增强YOLO目标检测算法在雾天条件下的性能。该框架包括一个基于Transformer架构的去雾网络,用于在检测任务之前提高雾天图像的可见度,并且提出了一个新的海事检测数据集MDHD,包含不同雾密度水平下的图像及其对应的无雾图像。实验结果表明,TD-YOLO在雾天条件下的目标检测准确率有显著提高。

Mamba-YOLO-World: Marrying YOLO-World withMamba for Open-Vocabulary Detection

内容:文章介绍了Mamba-YOLO-World,这是一个基于YOLO的开放词汇检测(OVD)模型,它通过提出的状态空间模型(SSM)基础的特征融合机制MambaFusion-PAN来解决YOLO-World中的性能限制问题。Mamba-YOLO-World利用线性复杂度和全局引导的感受野来提高模型在COCO和LVIS基准测试中的零样本和微调设置下的性能,同时保持与原始YOLO-World相当的参数和FLOPs,并超越了现有的OVD方法。

损失函数优化

A streamlined approach  for intelligent ship object detection  using EL‑YOLO algorithm

内容:文章介绍了一种名为EL-YOLO的算法,它是在YOLOv8基础上专为智能船舶目标检测而设计的。EL-YOLO通过集成AWIoU、SMFN和GDFP等新特性,提高了目标检测的准确

扫描下方二维码,回复「35yolo

免费获取全部论文合集及项目代码

数据增强

Source-Free Domain Adaptation for YOLO  Object Detection

内容:这篇文章介绍了一种名为SF-YOLO的目标检测领域自适应方法,它能够在不使用任何源域数据的情况下,将预训练的源模型适应到新的靶域,以解决隐私和效率问题。SF-YOLO基于教师-学生框架,学生模型接收学习到的、针对靶域特定的增强图像,允许仅使用未标记的靶域数据进行训练,无需特征对齐。为了解决在缺乏标签的情况下使用均值教师架构导致的准确度快速下降问题,文章提出了一种教师到学生的通信机制,以帮助稳定训练并减少对标注靶域数据的依赖。

模型训练策略优化

比如与迁移学习结合:利用在大规模图像数据集上预训练的YOLO模型作为起点,通过迁移学习技术进行微调,可以提升训练效率和识别性能

MODIPHY: Multimodal Obscured Detection for IoT  using PHantom Convolution-Enabled Faster YOLO

内容:文章介绍了一种名为“YOLO Phantom”的新型YOLO模型,它是专为物联网(IoT)设备在低光照和遮挡场景下进行目标检测而设计的。该模型通过使用“Phantom Convolution”块减少了参数和模型大小,同时保持了与YOLOv8n相当的准确性,并在Giga Floating Point Operations (GFLOPs)上实现了显著降低。YOLO Phantom利用多模态RGB-红外数据集进行迁移学习,以解决低光照和遮挡问题,并在IoT平台上通过与AWS基础通知端点的连接,展示了其在恶劣条件下的鲁棒视觉能力。

与多模态融合结合

SuperYOLO: Super Resolution Assisted Object  Detection in Multimodal Remote Sensing Imagery

内容:文章介绍了一种名为SuperYOLO的目标检测方法,它是为了提高多模态遥感图像中多尺度小目标的检测准确性和速度而设计的。SuperYOLO通过融合多模态数据,并利用超分辨率(SR)学习来提高低分辨率输入下的高分辨率目标检测性能,同时考虑了检测准确性和计算成本。该方法在VEDAI RS数据集上实现了75.09%的mAP50准确率,超过了现有的大型模型如YOLOv5l、YOLOv5x和YOLOrs,并且参数大小和GFLOPs显著减少,展示了与现有最先进模型相比更优的准确性和速度权衡。

扫描下方二维码,回复「35yolo

免费获取全部论文合集及项目代码



AI科研技术派
专注于人工智能领域。每日更新AI技术干货、前沿资讯、算法知识、论文/比赛推荐、面试分享等行业资源。
 最新文章