【魔改Mamba系列】UU-Mamba：用于图像分割的不确定性感知U-Mamba

科技 2024-11-23 10:05 中国香港

点击上方“小白学视觉”，选择加"星标"或“置顶”
重磅干货，第一时间送达

论文信息

题目：UU-Mamba: Uncertainty-aware U-Mamba for Cardiac Image Segmentation

UU-Mamba：用于心脏图像分割的不确定性感知U-Mamba

作者：Ting Yu Tsai，Li Lin，Shu Hu，Ming-Ching Chang，Hongtu Zhu，Xin Wang

源码：https://github.com/tiffany9056/UU-Mamba

论文创新点

不确定性感知损失函数：文章提出了一种新的不确定性感知损失函数，该函数整合了基于区域、基于分布和基于像素的损失，以提高分割精度和鲁棒性。这种设计允许模型优先考虑自信的预测并减少噪声数据的影响。
Sharpness-Aware Minimization (SAM) 优化器：作者将SAM优化器集成到模型中，该优化器通过寻找损失景观中的平坦最小值来增强泛化能力，减少过拟合，并提高模型对输入数据小扰动的鲁棒性。
UU-Mamba模型架构：文章介绍了UU-Mamba模型，这是U-Mamba模型的一个扩展，通过结合不确定性感知损失和SAM优化器，提高了心脏MRI分割的准确性和可靠性。

摘要

生物医学图像分割对于准确识别和分析医学成像中的解剖结构至关重要，特别是在心脏磁共振成像（MRI）中。手动分割劳动密集、耗时且容易出错，突显了自动化方法的需求。然而，当前的机器学习方法面临过拟合和数据需求等挑战。为了解决这些问题，作者提出了一个新的UU-Mamba模型，将U-Mamba模型与Sharpness-Aware Minimization（SAM）优化器和不确定性感知损失函数集成在一起。SAM通过在损失景观中定位平坦的最小值来增强泛化能力，从而减少过拟合。不确定性感知损失结合了基于区域、基于分布和基于像素的损失设计，以提高分割精度和鲁棒性。我们的方法在ACDC心脏数据集上进行了评估，超越了包括TransUNet、Swin-Unet、nnUNet和nnFormer在内的最先进模型。我们的方法在心脏MRI分割中实现了Dice相似系数（DSC）和均方误差（MSE）得分，证明了其有效性。

关键词

心脏图像分割，Mamba，ACDC数据集，不确定性感知损失，锐度感知最小化。

关键词

心脏图像分割
Mamba
ACDC数据集
不确定性感知损失
锐度感知最小化

方法

图2显示了我们提出的UU-Mamba架构的概览以及训练改进。§ III-A描述了Mamba块和U-Mamba网络，详细说明了状态空间模型及其在捕获长距离依赖性中的作用。§ III-B提出了我们提出的不确定性感知损失，解释了它如何结合多个损失函数以增强模型性能和鲁棒性。§ III-C描述了锐度感知最小化优化，突出了其在实现损失景观中的平坦最小值以改善泛化和减少过拟合方面的好处。

A. Mamba块和U-Mamba网络

U-Mamba网络整合了Mamba块和U-Net的优势，以增强全局上下文理解和提高医学图像分割的准确性。Mamba块为选择性结构化状态空间序列模型（S6）而设计，有效地处理长距离依赖性和序列信息，使其非常适合医学图像分割任务。状态空间模型（SSM）以输入状态向量、控制输入、过程噪声、状态转移矩阵和控制输入矩阵来描述系统，其基本形式由以下公式表示：

对于观测矩阵、直通矩阵和观测噪声，观测由以下公式给出：

S6架构通过选择性注意力机制和结构化参数化增强了传统的状态空间模型。具体来说，选择性注意力机制可以表示为：

其中、和是从状态向量派生的查询、键和值矩阵；是键向量的维度。这种选择性注意力机制专注于相关的输入序列部分，并捕获复杂的依赖性。在Mamba块中整合S6对于顺序医学图像处理至关重要，例如心脏MRI分割，捕获时间动态和结构是必不可少的。作者的方法专门针对每张图像的分割任务，将每个图像视为独立实体，这意味着状态转移和观测矩阵（A、C等）应用于单个图像。U-Mamba利用Mamba的线性扩展优势，改善了CNN的长距离依赖性建模，而没有像ViT和SwinTransformer这样的Transformer中使用的自注意力机制的高计算负担。图2显示了U-Mamba块，它由两个顺序残差块后跟一个Mamba块组成。每个块包括卷积层、实例归一化和Leaky ReLU激活。图像特征被展平、转置、归一化，并通过具有两个并行分支的Mamba块进行处理：一个带有SSM层，一个没有。这些特征通过哈达玛德积合并，投影回并转置到原始形状。完整的U-Mamba网络架构包括一个编码器，这些块捕获局部特征和长距离依赖性，以及一个解码器，由残差块和转置卷积组成，用于详细的局部信息和分辨率恢复。跳跃连接将编码器的层次特征链接到解码器，最终的解码器特征通过一个1×1×1卷积层和一个Softmax层传递以产生最终的分割概率图。

B. 不确定性感知损失

将不确定性整合到损失函数中涉及根据每个数据点的估计不确定性对损失函数的不同元素进行加权。这种方法允许模型优先从可靠的实例中学习，并最小化潜在错误或模糊数据的影响。Kendall和Gal引入了同质和异质不确定性的使用，以调整损失函数。同质不确定性在所有数据点之间是恒定的，而异质不确定性在实例之间变化。这种技术使模型能够根据这些不确定性调整其学习过程，通过关注自信的预测并减少模糊预测的影响，增强了韧性和精度。因此，它优化了在各种数据集上的训练过程，并提高了整体性能。

为了增强分割精度，作者实现了一个不确定性感知损失函数，它结合了以下基于区域、基于分布和基于像素的损失，利用它们的互补优势。

Dice系数（DC）损失：这种基于区域的度量强调预测和真实区域之间的重叠，保持分割区域的形状和边界的准确性。
交叉熵（CE）损失：这种基于分布的损失确保了单个像素的准确分类，提高了分类精度。
Focal损失：这种基于像素的损失通过赋予难以分类的实例更大的重要性来解决类别不平衡问题，增强了模型处理复杂场景的能力。

给定预测的分割和相应的真实掩码，让表示预测概率和表示真实标签。Dice相似系数（DSC）衡量预测分割和真实之间的重叠。它定义为：

DSC的范围从0到1，DSC为1表示预测和真实之间完全重叠，DSC为0表示没有重叠。为了在训练分割模型时将这个度量用作损失函数，我们定义Dice系数（DC）损失为：

DC损失旨在通过最大化DSC来最小化预测分割和真实之间的差异。通过最小化DC损失，模型被训练以产生与真实更重叠的分割，从而提高分割精度。交叉熵（CE）损失定义如下标准熵计算：

Focal损失旨在解决类别不平衡问题，通过更加关注难以分类的样本：

其中是聚焦参数，默认为2。我们通过将这些损失整合到一个不确定性感知框架中来定义不确定性感知损失：

其中是各个损失组件的数量，代表每个单独的损失组件（如DC、CE和focal损失），是可学习的参数，根据不确定性调整每个损失组件的贡献。这些可学习参数在训练过程中被优化以最小化整体损失。将不确定性引入损失计算允许模型动态分配每个损失组件的权重。这种方法有效地平衡了全局和局部精度，同时减轻了类别不平衡的影响。因此，模型对噪声或模糊数据更具韧性，导致整体分割性能的提高。

C. 锐度感知最小化优化

我们的方法涉及使用锐度感知最小化（SAM）优化来提高U-Mamba模型在分割心脏MRI图像（如ACDC数据集）中的性能。SAM优化使损失景观平坦，从而提高模型的泛化潜力。传统的优化技术旨在找到损失景观中的最低点，但这些点可能是陡峭的，导致在新数据上泛化性能差。相比之下，SAM识别更平滑的最小值，这些是在参数空间中模型性能更一致且不易受干扰的区域。使用SAM的动机在于其减轻过拟合的能力，这是医学图像分割中的一个常见挑战。传统的优化技术通常导致损失景观中的窄谷，导致在新数据上性能不佳。然而，SAM针对的是更平坦的最小值，这些与更好的泛化性能相关联。这对于处理像ACDC这样的复杂和多样化数据集特别有益，心脏MRI图像的变异性如果不妥善管理，可能会导致过拟合。SAM优化涉及一个迭代的两步过程。首先，对于每个小批量，参数被调整以最大化损失的方向。接下来，模型参数被更新以最小化最高改变的损失。这种扰动的目的是找到位于损失景观更平坦区域的模型参数，这些通常对应于更好的泛化和对输入数据小变化的鲁棒性。具体来说，让代表模型参数，代表损失函数，代表训练数据集。让代表扰动，控制周围邻域的大小。扰动被添加到参数以探索由范数约束定义的的局部邻域内的损失景观。SAM优化数学上被表述为：

第一步涉及在内找到最大化损失的扰动。这一步识别了的局部邻域中最坏情况的方向，确保模型参数被调整到损失景观不陡峭的区域。在第二步中，模型参数被更新以最小化这个最坏情况扰动位置的损失，使参数对扰动鲁棒。通过迭代应用这两个步骤，SAM确保优化器寻找对扰动鲁棒的参数配置，提高泛化和性能。这种方法帮助模型在损失景观中找到具有更好泛化的更平坦的最小值。

实验

声明

本文内容为论文学习收获分享，受限于知识能力，本文对原文的理解可能存在偏差，最终内容以原论文为准。本文信息旨在传播和学术交流，其内容由作者负责，不代表本号观点。文中作品文字、图片等如涉及内容、版权和其他问题，请及时与我们联系，我们将在第一时间回复并处理。

下载1：OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲
在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

http://mp.weixin.qq.com/s?__biz=MzU0NjgzMDIxMQ==&mid=2247626774&idx=2&sn=c639c6781b3066ed4924af544d831d2c

小白学视觉

哈工大在读博士的公众号，《OpenCV 4快速入门》的作者，面向初学者介绍计算机视觉基础知识、OpenCV使用、SLAM技术，深度学习等内容。

最新文章

博士招生 | 约翰霍普金斯大学PENSA实验室Sijia Geng 博士招生

【魔改Mamba系列】UU-Mamba：用于图像分割的不确定性感知U-Mamba

利用 YOLO11做停车管理

BT-Unet:医学图像分割的自监督学习框架

【魔改Mamba系列】HC-Mamba：用于医学图像分割的混合卷积技术视觉Mamba

详解机器学习中的7种交叉验证方法！

一文搞懂梯度下降

快速学会登上nature的热门算法，LSTM！

招生信息 | 墨尔本大学计算与信息系统学院 Dr. Ting Dang 诚招博士生

手把手教你用YOLOv8训练自己的数据集以及YOLOv8的多任务使用

手撕自动驾驶算法—无迹卡尔曼滤波

博士招生 | 南京大学智能科学与技术学院，范琦老师招收2025年入学的博士生，以及实习生、科研助理

【魔改UNet系列】IAUNet：实例感知的U-Net

收藏 | 10种顶级聚类算法实现

详解基于深度学习的伪装目标检测

年薪80w，我入局了

【Mamba应用前沿】CAMS: 基于Mamba的无卷积和无注意力的图像分割

数字图像基本处理算法小结

收藏 | 卷积神经网络压缩方法总结

招生信息 | 香港科技大学（广州）丁宁宁教授实验室博士招生

十个python图像处理工具

实践教程｜扩散模型代码复现

使用PyTorch进行知识蒸馏的代码示例

中文版的TPAMI，你听说过么！

招生信息 | 新泽西理工学院计算学院信息学系Dr. Chenxi Yuan 招募博士

如何消除摄影中的运动模糊?

漂亮，LSTM模型结构的可视化

目标检测和感受野的总结和想法

目标检测中的框位置优化总结

如何看待神经网络的黑箱？

如何使用深度学习进行缺陷检测

深度学习的图原理

饶毅：中国存在大量粗制滥造研究生的问题，很多博士不合格

路面语义分割

招生信息 | Emory大学计算机科学系Dr. Guo Zhichun实验室博士生招生

深度学习中的Normalization你懂了多少？

神经网络与傅立叶变换到底有没有关系？

从零开始构建DINO模型与PyTorch：自监督视觉transformer

涨点神器！100个即插即用缝合模块【合集下载】

深度学习最常用的10个激活函数！（数学原理+优缺点）

招生信息 | 香港城市大学计算机科学系Dr. Luo Yuhan诚邀加入BiWell实验室

实操教程｜PyTorch实现断点继续训练

又一本开源免费的大模型书来了，449页pdf！

有哪些东西是你读博士以后才懂的？

图像处理常用算法(基础)

少样本学习综述：技术、算法和模型

学术 | 热议：寒门硕士要不要继续读博士？

怎么才能优雅地向博士导师表达「这周科研没什么进展」？

医学影像相关开源数据集资源汇总

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

【魔改Mamba系列】UU-Mamba：用于图像分割的不确定性感知U-Mamba

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达论文信息

论文信息

题目：UU-Mamba: Uncertainty-aware U-Mamba for Cardiac Image Segmentation

UU-Mamba：用于心脏图像分割的不确定性感知U-Mamba

作者：Ting Yu Tsai，Li Lin，Shu Hu，Ming-Ching Chang，Hongtu Zhu，Xin Wang

源码：https://github.com/tiffany9056/UU-Mamba

论文创新点

摘要

关键词

关键词

方法

A. Mamba块和U-Mamba网络

B. 不确定性感知损失

C. 锐度感知最小化优化

实验

声明

点击上方“小白学视觉”，选择加"星标"或“置顶”
重磅干货，第一时间送达
论文信息