标题:ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale Residual Connections for Medical Image Segmentation
1、研究背景:
本文使用了多个公开数据集进行实验,包括DRIVE和CHASE(用于视网膜血管分割)、ISIC 2017和ISIC 2016(用于皮肤病变分割)、CVC-ClinicDB(用于息肉分割)、Montgomery County(MC)数据集(用于肺部分割)以及MoNuSeg(用于细胞核分割)。这些实验不仅验证了ESDMR-Net在处理多种医学影像分割任务上的竞争力,还显示了其在减少训练参数的同时提高了分割性能,这对于开发高效且精确的分割模型具有重要意义,特别是在资源受限环境中,对提升医疗工作者的工作效率和患者护理质量有直接影响。
2、论文创新点:2、增强特征保留与重用:通过使用skip连接和DMR块,网络在解码端实现了特征保留、梯度传播、上下文信息维护以及细粒度特征的高效再利用,从而提高了分割质量。
3、鲁棒性结构设计:网络的深层结构使其能够通过特征细化和累积对高度变化的特征具有鲁棒性,这对于复杂的医学图像分割任务至关重要。
4、适应资源有限环境:所设计的框架特别适合资源有限的场景,具有较低的资源占用率,同时保持了与现有方法相比具有竞争力的性能水平。
5、广泛验证与通用性:ESDMR-Net在五个不同的应用领域和七种不同的数据集上进行了评估,展示了其在多种医疗图像分割任务中的强大鲁棒性和泛化能力。
3、研究方法:
图1 ESDMR-Net的方框图
图1为ESDMR-Net的方框图。输入层首先由一个由卷积(Conv)、批量归一化和整正线性单元(ReLU)激活组成的输入块进行处理。随后,4个编码器和4个解码器块进一步提取多尺度信息。由卷积、批处理归一化、softmax激活和骰子像素分类组成的输出块的最终处理生成输出分割图。DMR块在编码器和解码器之间的跳接块,以及输入和输出块,便于信息的保存/恢复和网络的训练。
ESDMR-Net(Expand-Squeeze Dual Multiscale Residual Network)是一种轻量级网络,专门设计用于在资源受限的计算硬件上执行高效的医学图像分割任务。ESDMR-Net采用经典的编码器-解码器结构,包含四个编码器块和四个匹配的解码器块。这种结构旨在在编码-解码过程中提取、增强并保留全面的特征细节,同时考虑计算成本约束,确保高性能。ESDMR-Net的输入层接收原始图像作为输入,输入图像首先经过一个由卷积(Convolution)、批量归一化(Batch Normalization)和ReLU激活函数组成的输入块处理,以初始化特征提取过程。
每个编码器块包含多个分支,利用不同感受野的深度可分离卷积(Depthwise Separable Convolution)来捕获多尺度特征。这些卷积有助于分离跨通道相关性和空间相关性,从而提取更有意义的特征。同时利用平均池化(Average Pooling)以用于降低特征图的分辨率,逐步下采样以捕获更高级别的特征。
ES块是网络的核心,它首先执行扩张操作(使用深度可分离卷积),然后是挤压操作(通过瓶颈层,例如1x1卷积)。扩张操作旨在提取包含多尺度信息的重要特征,随后挤压操作从中提取必要信息用于分割任务。这有助于网络关注到未充分表示的类别,提高分割准确性。
此外在编码器和解码器间的跳连中加入了DMR块,目的是在不同分辨率或尺度上有效传输信息,使解码器能够访问来自多个抽象级别(不同编码器层)的特征。
解码器块与编码器块对应,但使用上采样(如双线性上采样Bilinear Upsampling)逆向操作来逐步恢复特征图的分辨率,同时结合来自编码器的特征。特征复用:通过跳连机制,解码器能够复用编码器的特征,结合多尺度信息,提高分割的精度和细节。
网络的最终输出通过包含卷积、批量归一化、Softmax激活和Dice像素分类的输出块产生分割图,以提供分割结果。
(2) Expand-Squeeze块的结构图如下图所示:
ES块,即Expand-Squeeze块,是ESDMR-Net网络中的一个核心组件,它的内部结构设计用于高效地提取和处理多尺度特征,具体包括以下几个步骤:
1) 输入处理:ES块接收来自前一层的特征图作为输入。
2) 激活函数:首先,输入通过ReLU(Rectified Linear Unit)激活函数,以引入非线性,激活神经元的响应。
3) 扩展操作:接着,使用深度可分离卷积(Depthwise Separable Convolution)进行扩展操作。这种操作先进行深度卷积,然后是点卷积,它可以在保持模型紧凑性的同时,捕获丰富的多尺度信息。与传统卷积相比,深度可分离卷积显著减少了计算成本和参数数量,同时保留了特征的表达能力。在ES块中,扩展层的滤波器尺寸是可变的,能够适应不同尺度的特征。
4) 挤压操作:经过扩展操作后,信息通过一个挤压层或瓶颈层处理。此层通常采用1×1的卷积(Identity Mapping),也称为挤压层,目的是在保持关键信息的同时压缩特征维度,提取出对任务最为关键的紧凑特征表示。
5) 归一化:在扩展和挤压操作之后,使用批量归一化(Batch Normalization)来稳定训练过程,加速收敛速度,并减少过拟合的风险。
通过这一系列的操作,ES块能够在保持模型轻量级的同时,有效地捕捉和提炼图像中的多尺度特征,加强了网络对不同尺度特征的学习能力。这不仅有助于提高网络对类内差异的区分能力,还能缓解类不平衡问题,从而在医疗图像分割任务中实现更高的分割准确度。
DMR块的基本结构和工作原理如下:
1) 输入接收:DMR块接受来自编码器(在最大池化之前的特征图)的输入特征。
2) 多尺度特征提取:
首先,使用3x3卷积核对输入特征Fin进行卷积操作,并通过批量归一化(βn)和ReLU激活函数处理,得到中间特征T1。接着,使用5x5卷积核对相同的输入特征进行卷积处理,同样经过归一化和激活,得到另一组特征T2。
3) 特征融合与增强:利用3x3卷积核对T1和T2的特征进行卷积融合,再次通过归一化和ReLU激活,得到融合特征T3。类似地,使用5x5卷积核对T2和T1进行融合卷积处理,得到另一融合特征T4。
4) 最终输出:
将T3和T4通过1x1卷积进一步融合,生成输出特征T',这个输出特征是双尺度特征融合的结果。为了保留原始特征信息,DMR块通常还会包含一个残差连接,即将原始输入Fin通过一个1x1卷积处理后与T'相加,形成最终的输出Fout。
本文设置的实验涵盖了七个不同的数据集如表1,涉及五个独特的应用实例,包括:视网膜血管分割:DRIVE和CHASE数据集;皮肤病变分析:ISIC 2016和ISIC 2017数据集;消化道息肉分割:CVC-ClinicDB数据集;肺部区域分割:未明确提及具体数据集名称,但根据上下文应指代一类相关的数据集;细胞分割:MoNuSeg数据集。实验中,数据集通过从图像的四角提取内容生成补丁,从而显著扩大了原始数据集的大小,增强了模型的训练和测试范围。
为了评估分割性能,采用了多种标准评价指标,包括:敏感性(Se)、特异性(Sp)、准确度(A)、F1分数、Jaccard系数(J),对于细胞图像分割,特别提到了平均Jaccard(J)、F1分数以及训练参数作为衡量指标。
本文的消融实验专注于评估将双多尺度残差(DMR)块集成到跳跃连接中的有效性。如表2所示,该实验通过对比ESDMR-Net在包含和不包含DMR块情况下的性能,特别是在ISIC 2016和ISIC 2017数据集上,这两个数据集专注于皮肤病学和皮肤病变分析。通过消融实验,本文证明了DMR块的加入显著提高了整体分割性能,表明它们对于信息跨多个分辨率或尺度的有效流动至关重要,以及在解码器端更好地利用不同抽象级别的特征,从而得到更全面的特征表示。
表1 本文所用到的数据集
ESDMR-Net在多个数据集上的实验结果表明了其在医学图像分割任务中的高效性能和广泛适用性。以下是针对每个数据集的具体实验结果概览:
视网膜血管分割:DRIVE数据集上如表3所示,ESDMR-Net达到了较高的F1分数,表明其在识别和分割视网膜血管方面的精确度高,能够在复杂的血管结构中准确区分血管与背景。CHASE数据集实验中,同样观察到了ESDMR-Net的优秀性能,F1分数显著,证明了它在不同数据集上的一致性和鲁棒性,如表4所示。
皮肤病变分割:在ISIC 2016和ISIC 2017数据集上,ESDMR-Net分别实现了极高的F1分数,说明该网络能有效识别皮肤图像中的病变区域,即便面对形态各异、大小不一的病灶,也能保持高分割精度。结果如表5所示。
消化道息肉分割:CVC-ClinicDB数据集实验中,ESDMR-Net展示了优异的F1分数,意味着它能准确地分割出消化道内的息肉,对临床诊断和治疗计划制定有重要价值。结果如表6所示。
肺部区域分割:ESDMR-Net在肺部图像分割任务中也取得了高F1分数,这表明它能有效处理肺部图像中的复杂结构,包括气道和组织区域的分割。结果如表7所示。
表3 DRIVE数据集上结果
表6 CVC-ClinicDB数据集上结果
表7 MC数据集上结果
表8 MoNuSeg数据集上结果
4、结论:
ESDMR-Net在五个不同的医学图像分割应用上的实验表明,尽管其训练参数显著少于其他前沿方法,但分割性能却超越了它们。这表明ESDMR-Net在开发既高效又精确的分割模型方面迈出重要一步,特别适合在资源有限的场景下部署,有利于医生诊断并改善患者护理。
论文还进行了消融研究,特别是在ISIC 2016和ISIC 2017皮肤疾病和皮肤病变分析数据集上,验证了DMR块加入到跳跃连接中的有效性。结果显示,整合DMR块显著提升了整体性能,这得益于更好的信息传递、梯度传播、更大的感受野以及细粒度特征的有效利用。此外,网络的深架构能够捕捉复杂的高频细节和边界结构,这对于准确分割皮肤病变至关重要。
综上所述,ESDMR-Net通过其创新的设计,不仅提高了医学图像分割的准确性和泛化能力,还为实际应用提供了一个计算负担小的解决方案,展示了在医疗影像分析领域的重要进步。