【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

文摘科技 2024-04-03 16:05 江苏

标题：CFU-Net: A Coarse–Fine U-Net With Multilevel Attention for Medical Image Segmentation

来源：IEEE Transactions on Instrumentation and Measurement 72 (2023): 5020412.

作者：Haitao Yin , and Yudong Shao

单位：Nanjing University of Posts and Telecommunications

1、研究背景：

医学图像分割是一项关键的计算机视觉任务，旨在准确地定位和分割医学图像中的病变区域，为医学诊断和治疗提供重要支持。早期的医学图像分割方法主要涉及阈值分割，聚类区域生长，边缘检测等，这些传统方法可以很好地分割均匀区域，但对非均匀区域的分割效果较差。

最近，基于深度学习的方法在医学图像分割领域中逐渐得到推广，它们采用卷积神经网络逐像素分类提取图像特征。医学图像分割具有代表性的深度学习网络是以编码器-解码器架构的U-Net。但是现有的U-Net只采用了编码器和解码器之间的特征级传播，而忽略了决策级传播，且大多数方法都是针对具有单一图像模式设计的，多模态图像的特征之间存在很大差异，因此对于不同的病变和器官以及不同的模态图像，这些方法实现的效果不理想。

2、论文创新点：

1、本文的网络结构提出了一种粗-细框架，即CFU-Net，通过嵌入粗U-Net和细U-Net，提供了更好的任务感知性，提高了网络的分割准确性。

2、本文提出了多级注意力模块（MLAM），有效地整合了决策引导、信道相互依赖和空间远程依赖等不同层次的注意信息。

3、本文编码器中采用动态卷积，使网络在不同分割任务上取得了可比较的结果，展现了较好的泛化能力。

3、研究方法：

图1 CFU-Net网络结构

本文将一个小的粗U-Net嵌入一个大的细U-Net中，形成一个粗-细框架。如图1所示，CFU-Net由一条编码路径、一条粗解码路径和一条精解码路径组成。

图2 编码器结构图

如图2所示，编码器的目标是对输入医学图像的语义特征进行编码。CFU-Net中的编码路径共包含5个编码器块，具体来说，每个编码器块由两个动态卷积层以及BN层和ReLU激活函数组成。传统卷积中的参数是静态的，所有输入都是共享的。相比之下，动态卷积层也被称为卷积核的注意力，它自适应地学习每个输入的权重，可以在不增加模型参数的情况下，网络的表达能力得到了提高。

图3 解码器结构图

如图3所示，解码器用于提取图像特征，进行逐像素分类。本文提出的CFU-Net包含两条解码路径，即粗解码路径和精解码路径。粗解码路径包含3个解码器块，该解码器块由两个3x3 卷积、BN和ReLU组成。解码器的上采样层由4x4转置卷积组成，该层将图像空间大小放大到2倍，信息通道减半。精细解码路径在跳连接和不同尺度的中间分割两个方面进行了创新。

图4 MLAM结构图

如图4所示，MLAM模块由决策注意力块、通道注意力块和自注意力块三部分组成，分别实现决策先验指导解码，增强信息特征通道，捕获空间远程依赖关系。通过三层注意力模块之间的相互作用，MLAM不仅可以减少编码器和解码器之间的特征差距，还可以提高任务自适应能力和上下文信息依赖性。

CFU-Net网络损失函数由二值交叉熵损失和Dice Loss组成，并在精细解码路径并设计了一个多尺度监督损失函数。

论文的实验部分，本文将提出的CFU-Net模型与基于U-Net改进的六种深度学习分割方法包括U-Net，U-Net++，Attention UNet，Residual U-Net，ResU-Net++和UNeXt在标准数据集ISIC2018、BUSI、Kvasir-SEG、LiTS上进行比较，评价指标采用Dice、IoU、Accuracy、Precision、Recall、Specificity。

如表1在ISIC2018数据集上，与最新的UNeXt相比，我们的方法在Dice和IoU上分别实现了0.82%和1.62%的改进，ResUNet++在精度度量上得分最高，略优于我们的方法。如表2在BUSI数据集上，CFU-Net与其他对比网络的分割性能相比，Dice、IoU、Accuracy、Precision和Recall的值最高。如表3在Kvasir-SEG I数据集上，CFU-Net在所有指标上都优于其他对比网络。如表4，在LiTS数据集上，CFU-Net在Dice和mIoU指标方面都优于其他对比网络。

表1 ISIC2018数据集上与其他网络之间的分割定量比较

表2 BUSI数据集上与其他网络之间的分割定量比较

表3 Kvasir-SEG数据集上与其他网络之间的分割定量比较

表4 LiTS数据集上与其他网络之间的分割定量比较

为了进一步表现本文网络的性能，本文计算了分割结果与Ground Truth之间的绝对残差，然后在图5中进行可视化。通过图5，我们可以直观地看到CFU-Net生成的错误预测像素更少，并且与UNeXt残差分割图比较，该方法所获得的分割结果更加准确。

图5 UNeXt与CFU-Net的残差比较，绿色和红色区域分别代表假阴性和假阳性

本文使用众所周知的千兆浮点运算(GFLOPs)、推理速度和参数量来量化计算复杂性，如表5所示。对于GFLOPs和推理速度，我们的方法分别排在第二和第三位，虽然模型参数量大小偏高，但是本文网络在分割精度和推理速度之间取得了较好的平衡。

表5 与其他网络之间的计算复杂度比较

收敛性是评价模型训练稳定性的重要指标，如图6所示，特别是在50轮之后，我们方法的损失曲线比其他对比方法下降得更快，并且在其他三个数据集上的训练具有相同的收敛趋势。

图6 ISIC2018数据集上不同方法的损失曲线

本文通过消融实验，验证了MLAM模块，动态卷积和损失函数对CFU-Net的性能影响。表6实验结果表明，MLAM可以显著提升网络性能，特别是在Dice和IoU方面分别提升了2.04%和3.23%。表7表明动态卷积在所有指标上均优于传统卷积，IoU的提升达到了1.5%。表8表明损失函数中可以显著提升网络性能。

表6 MLAM模块消融实验定量比较

表7 动态卷积消融实验定量比较

表8 损失函数消融实验定量比较

最后，本文讨论了 CFU-Net的局限性，图7显示了从不同数据集中分割的一些失败案例。可以看出，第一行由于毛发和黄斑的严重干扰，第二行由于图像存在对比度极低的情况，第三行由于图像存在光照不均匀的问题，最后一行由于正常器官和病变器官界限不清会给分割带来一定的挑战，导致分割不准确。本文也表明在未来的工作中，将研究一种更鲁棒的分割方法

图7 CFU-Net的失败案列

4、结论：

本文提出了CFU-Net用于医学图像分割，提出一种粗-细框架。本文设计了一种新颖的注意力模块，即MLAM，用于调整精细U-Net深层的跳跃连接中的特征，由三个不同级别的注意力块组成，分别是决策注意力块、通道注意力块和自注意力块。在四个具有不同模态的医学图像数据集上的实验结果显示本文的CFU-Net与基于U-Net改进的最新方法网络分割性能相当。此外，跨模态测试也验证了本文的CFU-Net具有显著的泛化能力。

http://mp.weixin.qq.com/s?__biz=MzU1ODg5NzQ0NA==&mid=2247484861&idx=1&sn=9d32140cb1157468564fa483557566e1

智能自主无人系统课题组

智能自主无人系统（IAUS）课题组坚持“面向国家重大科技需求，引领行业技术进步”的思路，专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究，分享和发布最新科研动态及研究成果。

最新文章

【论文荐读】基于多智能体近端策略优化的有限感知无人艇集群分布式追逃博弈

课题组硕士研究生成果发表在工业人工智能领域TOP期刊IEEE TIM

【论文荐读】滤波融合：图像-激光雷达融合的3D目标检测

【论文荐读】基于Pathways架构的自适应多尺度时间序列预测

【论文荐读】一种用于表面缺陷实时检测的高效靶向设计方法

【论文荐读】基于深度强化学习的VUCA环境下机器人无地图导航

课题组硕士研究生成果发表在工业人工智能领域一区TOP期刊Computers in Industry

【论文荐读】具备预判避碰决策的无人艇集成智能引导和运动控制研究

【论文荐读】面向表面缺陷检测的多分支结构多层特征融合网络

【论文荐读】一种用于粒度分析的煤粉图像分割方法

【论文荐读】水声目标识别的联合学习模型

【论文荐读】未知环境下多机器人协同探索的混合多策略快速探索随机树算法

【论文荐读】速度与输入受限的多机器人系统鲁棒避障编队导航方法

【论文荐读】基于机器视觉的目标检测技术二十年发展综述

【论文荐读】基于自适应类内和类间卷积神经网络的变速箱变工况智能故障诊断

【论文荐读】ESDMR-Net：一种具有扩展压缩和双多尺度残差连接的轻型网络

【论文荐读】基于多智能体强化学习的无人艇协同多目标围捕

【论文荐读】时间序列预测：一种具有概率分解表示的分层Transformer

【论文荐读】基于深度强化学习和分布式优化的未知环境下多机器人导航与编队控制

21级专硕王家卿《面向空地协同的无人机对地目标跟踪与自主降落研究》

21级学硕鲁宇琦《水面无人艇集群协同的侦察-驱逐-布防控制方法研究》

21级专硕夏煜《基于红外热成像的铝箔封口缺陷检测研究》

21级学硕吴建彬《退化环境下激光雷达与IMU融合的移动机器人自主探索研究》

21级学硕王浩《数据驱动的绞吸船横移挖掘过程建模及自学习控制研究》

【论文荐读】基于近端策略优化的有限感知无人艇集群避障

21级专硕杨颖《基于机器视觉的柱状产品贴标及喷码缺陷检测研究》

22级学硕李亚军《基于激光和视觉融合的移动机器人自主导航研究》

【论文荐读】基于CNN和Transformer的无人机实时目标检测网络

【论文荐读】一种能够学习多尺度上下文感知特征的通用伪装目标检测框架

【论文荐读】一种具有多级注意力机制的U-Net医疗图像分割方法

【论文荐读】一种用于表面缺陷检测的具有全局和局部特征增强的实时无锚缺陷检测器

【论文荐读】MLDFR：一种用于异常检测和定位的受损图像多级特征恢复方法

【论文荐读】基于几何线索提取和圆分解的多机器人复杂场景探索

【论文荐读】不同环境下从避障到可推动障碍物导航的课程强化学习

【论文荐读】基于机器视觉的径向圆跳动测量方法

【论文荐读】关于迁移学习驱动的智能故障诊断设计的调查、见解和展望

【论文荐读】UIU-Net: 用于红外小目标检测嵌套U-Net模型

【论文荐读】3U:面向协同目标搜索的UAV-USV-UUV网络联合设计

【论文荐读】基于深度强化学习的无人船避障方法

【论文荐读】基于优化权重谱指数的机械故障诊断自适应故障分量提取

【论文荐读】基于异步多智能体强化学习的高效实时多机器人协同探索

【论文荐读】MR-TopoMap: 通信受限条件下基于拓扑图的多机器人探索

【论文荐读】面向多智能体强化学习的共享学习方法

【论文荐读】多模态融合的自主导航方法：采用稀疏奖励和事后经验回放策略的深度强化学习

【论文荐读】基于图像增强和改进Faster R-CNN的故障卫星部件检测方法

【论文荐读】空间变形鲁棒场景中构建超分辨率文本图像的文本注意网络

【论文荐读】基于深度学习的二维激光雷达车辆检测

【论文荐读】Informer：超越Transformer的长序列时间序列预测方法

【文献综述】深度学习和深度强化学习的特征提取网络

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉