点击下方“深度学习爱好者”,选择加"星标"或“置顶”
论文信息
题目:LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation
LightM-UNet:Mamba助力轻量级UNet进行医学图像分割
作者:Weibin Liao, Yinghao Zhu, Xinyuan Wang, Chengwei Pan, Yasha Wang, Liantao Ma
源码:https://github.com/MrBlankness/LightM-UNet
论文创新点
LightM-UNet 是一种基于Mamba的轻量级网络,用于医学图像分割,具有以下几个创新点:
轻量级架构:作者提出了LightM-UNet,这是一个轻量级的UNet和Mamba的融合,仅拥有1M的参数数量。这是通过在UNet架构中使用Mamba来实现的,旨在解决实际医疗环境中计算资源限制所带来的挑战。
残差视觉Mamba层(RVM层):作者提出了残差视觉Mamba层来增强原始的状态空间模型块,用于深度语义特征提取。这一改进几乎不引入新的参数和计算复杂度,同时通过使用残差连接和调整因子,增强了模型对长距离空间依赖性的建模能力。
性能提升:在与现有的最先进模型进行比较时,LightM-UNet在参数和计算成本上实现了显著的减少。特别是与著名的nnU-Net相比,LightM-UNet在减少参数和计算成本116倍和21倍的同时,实现了更优越的分割性能。
摘要
UNet及其变体已广泛用于医学图像分割。然而,这些模型,尤其是基于Transformer架构的模型,由于参数众多和计算负载大,给移动健康应用带来了挑战。最近,状态空间模型(SSMs),如Mamba,作为CNN和Transformer架构的有力替代品出现。基于此,作者将Mamba作为轻量级替代CNN和Transformer在UNet中的使用,旨在解决实际医疗环境中计算资源限制所带来的挑战。为此,我们介绍了轻量级Mamba UNet(LightM-UNet),它将Mamba和UNet集成在一个轻量级框架中。具体来说,LightM-UNet利用纯Mamba方式的残差视觉Mamba层来提取深层语义特征和模拟长距离空间依赖性,计算复杂度为线性。在两个真实世界的2D/3D数据集上进行的广泛实验表明,LightM-UNet超越了现有的最先进文献。特别是与著名的nnU-Net相比,LightM-UNet在大幅降低参数和计算成本116倍和21倍的同时,实现了更优越的分割性能。这突出了Mamba在促进模型轻量化方面的潜力。
关键字
医学图像分割 · 轻量级模型 · 状态空间模型
2 方法论
尽管LightM-UNet支持医学图像分割的2D和3D版本,但为了方便起见,本文以LightM-UNet的3D版本来描述方法论。
2.1 架构概述
2.2 编码器块
2.3 残差视觉Mamba层(RVM层)
2.4 视觉状态空间模块(VSS模块)
3 实验
声明
下载1:Pytoch常用函数手册 在「深度学习爱好者」公众号后台回复:Pytorch常用函数手册,即可下载全网第一份Pytorch常用函数手册,涵盖Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多线程处理等十四章章内容。 下载2:Python视觉实战项目52讲 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。 交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~