今天给大家推荐一个能发顶会且好出创新点的方向:Mamba+YOLO!
一方面,Mamba擅长捕获全局上下文信息,且具有线性复杂度;而YOLO擅长提取局部特征。两者结合能够优势互补,获取更加全面、准确的信息,从而提高检测精度、增强鲁棒性、降低计算复杂度!比如模型Mamba YOLO,在精度比YOLOv8高6.1%的同时,参数减少45.5%,FLOPs减少50%!
另一方面,由于YOLO是目标检测的核心模型之一,传统的魔改思路早已“杀”成红海!而Mamba作为新技术,基于其对YOLO进行改进,目前还在起步阶段,还不卷,以往做过的任务,都可以用该方法重做一遍,创新空间很广!
为了方便大家掌握该方法的精髓,落地到自己的顶会中,我给大家准备了10种前沿思路,原文和源码都有!
扫描下方二维码,回复「MYO」
免费获取全部论文合集及项目代码
Mamba YOLO: SSMs-Based YOLO For Object Detection
内容:论文介绍了一种名为Mamba YOLO的新型目标检测模型,它基于状态空间模型(SSMs),并专门针对目标检测任务进行了优化。该模型通过引入LSBlock和RGBlock来增强对局部图像依赖性的捕获能力,并显著提升了模型的鲁棒性。在COCO和VOC基准数据集上的广泛实验结果表明,Mamba YOLO在性能和竞争力方面超越了现有的YOLO系列模型,并展示了其巨大的潜力和竞争优势。
FER-YOLO-Mamba: Facial Expression Detection and Classification Based on Selective State Space
内容:论文介绍了一个名为FER-YOLO-Mamba的面部表情识别模型,它结合了YOLO技术和Mamba状态空间模型(SSM)来提高面部表情图像的识别和定位效率。模型设计了一个具有双分支结构的FER-YOLO-VSS模块,一边利用卷积层进行局部特征提取,另一边使用状态空间模型捕捉长距离依赖关系。实验结果表明,FER-YOLO-Mamba在RAF-DB和SFEW两个基准数据集上的表现优于其他模型。
扫描下方二维码,回复「MYO」
免费获取全部论文合集及项目代码
YOLO-Mamba: Object Detection Method for Infrared Aerial Images
内容:YOLO-Mamba 是一种针对红外航空图像的目标检测方法,它结合了YOLO系列算法的速度优势和Mamba架构的全局建模能力,以提高对红外图像中目标的检测准确性,特别是在小目标和有限特征信息的情况下。该方法通过引入改进的网络结构和特征融合策略,增强了模型对红外图像中目标的识别和定位能力,适用于无人机侦察、交通监控等场景。
DS MYOLO: A Reliable Object Detector Based on SSMs for Driving Scenarios
内容:论文介绍了一种名为DS MYOLO的新型可靠目标检测器,它基于状态空间模型(SSMs)为驾驶场景设计。该检测器通过简化的自愿扫描融合块(SimVSS Block)捕获全局特征信息,并有效整合网络的深层特征。此外,论文还提出了一种高效的通道注意力卷积(ECAConv),在保持低计算复杂度的同时增强了跨通道特征的交互。在CCTSDB 2021和VLD-45驾驶场景数据集上的广泛实验表明,DS MYOLO在同类规模的YOLO系列实时目标检测器中展现出显著的潜力和竞争优势。
YOLOv5_mamba: Unmanned Aerial Vehicle Object Detection Based on Bidirectional Dense Feedback Network and Adaptive Gate Feature FusionYOLOv5_mamba
内容:文章介绍了一种名为YOLOv5_mamba的无人机航空图像目标检测系统,它基于双向密集反馈网络和自适应门控特征融合技术。该系统通过引入YOLOv8中的C2f模块来增强骨干网络的特征提取能力,并构建了双向密集反馈网络以增强上下文信息的传递。此外,还提出了一种自适应门控特征融合网络来提升YOLOv5的检测头部,从而增强其最终检测能力。在VisDrone2019公共无人机数据集上的实验结果表明,与原始的YOLOv5基线网络相比,提出的算法将检测精度提高了9.3%,特别是在小目标检测方面表现出更好的性能。在UCAS_AOD数据集上,提出的算法比YOLOv5-s提高了9%,在DIOR数据集上超过了YOLOv5-s的12%。
扫描下方二维码,回复「MYO」
免费获取全部论文合集及项目代码