【论文荐读】ESDMR-Net:一种具有扩展压缩和双多尺度残差连接的轻型网络

文摘   科技   2024-05-24 19:31   江苏  


标题:ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale Residual Connections for Medical Image Segmentation

来源:Engineering Applications of Artificial Intelligence, 133 (2024): 107995.
作者:Tariq M. Khan, Erik Meijering, Syed S. Naqvi
单位:School of Computer Science and Engineering, University of New South Wales, Sydney, NSW, Australia; Department of Electrical and Computer Engineering, COMSATS University Islamabad, Pakistan.

1、研究背景:

本文的研究背景主要聚焦于医学影像分割这一关键任务,该任务在计算机视觉应用中尤为重要,特别是在医学影像分析领域。近年来,随着基于复杂卷积神经网络架构的医学影像分割方法的不断演进,性能在公认的基准数据集上取得了渐进式提升。然而,大多数现有方法对计算资源的需求较高,这限制了它们在实际应用中的普及性和可行性,尤其是在资源受限的硬件如移动设备上。
针对这一挑战,本文提出了ESDMR-Net(Expand-Squeeze Dual Multiscale Residual Network),这是一种全卷积网络,特别适合在资源有限的计算环境下运行。该网络设计旨在提取多尺度特征,促进语义上不同特征间的上下文依赖学习。ESDMR-Net采用扩展-挤压(Expand-Squeeze, ES)模块和双多尺度残差(Dual Multiscale Residual, DMR)块来优化信息流动和增强特征表示,进而改善分割精度。其中,扩展操作(深度可分离卷积)使多尺度的丰富特征可用于挤压操作(瓶颈层),后者则提取分割任务所需的信息。而DMR块整合到跳连结构中,促进了跨多个分辨率或尺度的信息传递,使得解码器能访问不同抽象级别的特征,最终得到更全面的特征表示。

本文使用了多个公开数据集进行实验,包括DRIVE和CHASE(用于视网膜血管分割)、ISIC 2017和ISIC 2016(用于皮肤病变分割)、CVC-ClinicDB(用于息肉分割)、Montgomery County(MC)数据集(用于肺部分割)以及MoNuSeg(用于细胞核分割)。这些实验不仅验证了ESDMR-Net在处理多种医学影像分割任务上的竞争力,还显示了其在减少训练参数的同时提高了分割性能,这对于开发高效且精确的分割模型具有重要意义,特别是在资源受限环境中,对提升医疗工作者的工作效率和患者护理质量有直接影响

2、论文创新点:

1、创新网络架构:提出了一种新的深度卷积网络架构,该架构采用ES块,能够改善特征表示,有效处理医疗图像中的高频变化和特征多样性。

2、增强特征保留与重用:通过使用skip连接和DMR块,网络在解码端实现了特征保留、梯度传播、上下文信息维护以及细粒度特征的高效再利用,从而提高了分割质量。

3、鲁棒性结构设计:网络的深层结构使其能够通过特征细化和累积对高度变化的特征具有鲁棒性,这对于复杂的医学图像分割任务至关重要。

4、适应资源有限环境:所设计的框架特别适合资源有限的场景,具有较低的资源占用率,同时保持了与现有方法相比具有竞争力的性能水平。

5、广泛验证与通用性:ESDMR-Net在五个不同的应用领域和七种不同的数据集上进行了评估,展示了其在多种医疗图像分割任务中的强大鲁棒性和泛化能力

3、研究方法:

(1) ESDMR-Net的方框图如下图所示:

图1 ESDMR-Net的方框图

图1为ESDMR-Net的方框图。输入层首先由一个由卷积(Conv)、批量归一化和整正线性单元(ReLU)激活组成的输入块进行处理。随后,4个编码器和4个解码器块进一步提取多尺度信息。由卷积、批处理归一化、softmax激活和骰子像素分类组成的输出块的最终处理生成输出分割图。DMR块在编码器和解码器之间的跳接块,以及输入和输出块,便于信息的保存/恢复和网络的训练。

ESDMR-Net(Expand-Squeeze Dual Multiscale Residual Network)是一种轻量级网络,专门设计用于在资源受限的计算硬件上执行高效的医学图像分割任务。ESDMR-Net采用经典的编码器-解码器结构,包含四个编码器块和四个匹配的解码器块。这种结构旨在在编码-解码过程中提取、增强并保留全面的特征细节,同时考虑计算成本约束,确保高性能。ESDMR-Net的输入层接收原始图像作为输入,输入图像首先经过一个由卷积(Convolution)、批量归一化(Batch Normalization)和ReLU激活函数组成的输入块处理,以初始化特征提取过程。

每个编码器块包含多个分支,利用不同感受野的深度可分离卷积(Depthwise Separable Convolution)来捕获多尺度特征。这些卷积有助于分离跨通道相关性和空间相关性,从而提取更有意义的特征。同时利用平均池化(Average Pooling)以用于降低特征图的分辨率,逐步下采样以捕获更高级别的特征。

ES块是网络的核心,它首先执行扩张操作(使用深度可分离卷积),然后是挤压操作(通过瓶颈层,例如1x1卷积)。扩张操作旨在提取包含多尺度信息的重要特征,随后挤压操作从中提取必要信息用于分割任务。这有助于网络关注到未充分表示的类别,提高分割准确性。

此外在编码器和解码器间的跳连中加入了DMR块,目的是在不同分辨率或尺度上有效传输信息,使解码器能够访问来自多个抽象级别(不同编码器层)的特征。

解码器块与编码器块对应,但使用上采样(如双线性上采样Bilinear Upsampling)逆向操作来逐步恢复特征图的分辨率,同时结合来自编码器的特征。特征复用:通过跳连机制,解码器能够复用编码器的特征,结合多尺度信息,提高分割的精度和细节。

网络的最终输出通过包含卷积、批量归一化、Softmax激活和Dice像素分类的输出块产生分割图,以提供分割结果。

(2) Expand-Squeeze块的结构图如下图所示:

2   Expand-Squeeze块结构图

ES块,即Expand-Squeeze块,是ESDMR-Net网络中的一个核心组件,它的内部结构设计用于高效地提取和处理多尺度特征,具体包括以下几个步骤:

1) 输入处理:ES块接收来自前一层的特征图作为输入。

2) 激活函数:首先,输入通过ReLU(Rectified Linear Unit)激活函数,以引入非线性,激活神经元的响应。

3) 扩展操作:接着,使用深度可分离卷积(Depthwise Separable Convolution)进行扩展操作。这种操作先进行深度卷积,然后是点卷积,它可以在保持模型紧凑性的同时,捕获丰富的多尺度信息。与传统卷积相比,深度可分离卷积显著减少了计算成本和参数数量,同时保留了特征的表达能力。在ES块中,扩展层的滤波器尺寸是可变的,能够适应不同尺度的特征。

4) 挤压操作:经过扩展操作后,信息通过一个挤压层或瓶颈层处理。此层通常采用1×1的卷积(Identity Mapping),也称为挤压层,目的是在保持关键信息的同时压缩特征维度,提取出对任务最为关键的紧凑特征表示。

5) 归一化:在扩展和挤压操作之后,使用批量归一化(Batch Normalization)来稳定训练过程,加速收敛速度,并减少过拟合的风险。

通过这一系列的操作,ES块能够在保持模型轻量级的同时,有效地捕捉和提炼图像中的多尺度特征,加强了网络对不同尺度特征的学习能力。这不仅有助于提高网络对类内差异的区分能力,还能缓解类不平衡问题,从而在医疗图像分割任务中实现更高的分割准确度。

(3) DMR(Dual Multiscale Residual)块的结构图如下图所示:

3 DMR块结构图

DMR块的基本结构和工作原理如下:

1) 输入接收:DMR块接受来自编码器(在最大池化之前的特征图)的输入特征。

2) 多尺度特征提取:

首先,使用3x3卷积核对输入特征Fin进行卷积操作,并通过批量归一化(βn)和ReLU激活函数处理,得到中间特征T1。接着,使用5x5卷积核对相同的输入特征进行卷积处理,同样经过归一化和激活,得到另一组特征T2。

3) 特征融合与增强:利用3x3卷积核对T1和T2的特征进行卷积融合,再次通过归一化和ReLU激活,得到融合特征T3。类似地,使用5x5卷积核对T2和T1进行融合卷积处理,得到另一融合特征T4。

4) 最终输出:

将T3和T4通过1x1卷积进一步融合,生成输出特征T',这个输出特征是双尺度特征融合的结果。为了保留原始特征信息,DMR块通常还会包含一个残差连接,即将原始输入Fin通过一个1x1卷积处理后与T'相加,形成最终的输出Fout。

本文设置的实验涵盖了七个不同的数据集如表1,涉及五个独特的应用实例,包括:视网膜血管分割:DRIVE和CHASE数据集;皮肤病变分析:ISIC 2016和ISIC 2017数据集;消化道息肉分割:CVC-ClinicDB数据集;肺部区域分割:未明确提及具体数据集名称,但根据上下文应指代一类相关的数据集;细胞分割:MoNuSeg数据集。实验中,数据集通过从图像的四角提取内容生成补丁,从而显著扩大了原始数据集的大小,增强了模型的训练和测试范围。

为了评估分割性能,采用了多种标准评价指标,包括:敏感性(Se)、特异性(Sp)、准确度(A)、F1分数、Jaccard系数(J),对于细胞图像分割,特别提到了平均Jaccard(J)、F1分数以及训练参数作为衡量指标。

本文的消融实验专注于评估将双多尺度残差(DMR)块集成到跳跃连接中的有效性。如表2所示,该实验通过对比ESDMR-Net在包含和不包含DMR块情况下的性能,特别是在ISIC 2016和ISIC 2017数据集上,这两个数据集专注于皮肤病学和皮肤病变分析。通过消融实验,本文证明了DMR块的加入显著提高了整体分割性能,表明它们对于信息跨多个分辨率或尺度的有效流动至关重要,以及在解码器端更好地利用不同抽象级别的特征,从而得到更全面的特征表示

表1 本文所用到的数据集

2 DMR块对该网络性能的影响

ESDMR-Net在多个数据集上的实验结果表明了其在医学图像分割任务中的高效性能和广泛适用性。以下是针对每个数据集的具体实验结果概览:

视网膜血管分割:DRIVE数据集上如表3所示,ESDMR-Net达到了较高的F1分数,表明其在识别和分割视网膜血管方面的精确度高,能够在复杂的血管结构中准确区分血管与背景。CHASE数据集实验中,同样观察到了ESDMR-Net的优秀性能,F1分数显著,证明了它在不同数据集上的一致性和鲁棒性,如表4所示。

皮肤病变分割:在ISIC 2016和ISIC 2017数据集上,ESDMR-Net分别实现了极高的F1分数,说明该网络能有效识别皮肤图像中的病变区域,即便面对形态各异、大小不一的病灶,也能保持高分割精度。结果如表5所示。

消化道息肉分割:CVC-ClinicDB数据集实验中,ESDMR-Net展示了优异的F1分数,意味着它能准确地分割出消化道内的息肉,对临床诊断和治疗计划制定有重要价值。结果如表6所示。

肺部区域分割:ESDMR-Net在肺部图像分割任务中也取得了高F1分数,这表明它能有效处理肺部图像中的复杂结构,包括气道和组织区域的分割。结果如表7所示。

细胞核分割:在MoNuSeg数据集中,ESDMR-Net取得了出色的F1分数,这表明它能够精确地区分和分割细胞核,这对于病理学研究和癌症诊断至关重要。结果如表8所示

3 DRIVE数据集上结果

表4 CHASE数据集上结果
表5 ISIC 2016和ISIC 2017数据集上结果

表6 CVC-ClinicDB数据集上结果

7 MC数据集上结果

表8 MoNuSeg数据集上结果

总体而言,ESDMR-Net在这些不同类型的医学图像分割任务上的出色表现,证明了其作为一种高效、通用的分割模型的价值,尤其适合在资源有限的环境中应用,为医学影分析提供了有力支持

4、结论:

本文介绍了一种名为ESDMR-Net的轻量级深度卷积网络,专门设计用于医疗图像分割,尤其适用于资源受限环境如移动设备。该网络通过引入Expand-Squeeze(ES)模块和双多尺度残差(DMR)连接,在提高分割精度和处理医学图像中高频特征及变化的同时,保持了计算效率。ES模块通过扩展(使用深度可分离卷积提取多尺度特征)和挤压(瓶颈层提取关键信息)操作,帮助网络更好地关注样本不足的类别,从而提升分割准确性。DMR块集成到跳跃连接中,促进了跨多个分辨率或尺度的信息流动,使解码器能访问不同抽象级别的特征,生成更全面的特征表示。

ESDMR-Net在五个不同的医学图像分割应用上的实验表明,尽管其训练参数显著少于其他前沿方法,但分割性能却超越了它们。这表明ESDMR-Net在开发既高效又精确的分割模型方面迈出重要一步,特别适合在资源有限的场景下部署,有利于医生诊断并改善患者护理。

论文还进行了消融研究,特别是在ISIC 2016和ISIC 2017皮肤疾病和皮肤病变分析数据集上,验证了DMR块加入到跳跃连接中的有效性。结果显示,整合DMR块显著提升了整体性能,这得益于更好的信息传递、梯度传播、更大的感受野以及细粒度特征的有效利用。此外,网络的深架构能够捕捉复杂的高频细节和边界结构,这对于准确分割皮肤病变至关重要。

综上所述,ESDMR-Net通过其创新的设计,不仅提高了医学图像分割的准确性和泛化能力,还为实际应用提供了一个计算负担小的解决方案,展示了在医疗影像分析领域的重要进步



智能自主无人系统课题组
智能自主无人系统(IAUS)课题组坚持“面向国家重大科技需求,引领行业技术进步”的思路,专注于人工智能技术在自主无人系统、机器人、智能工程装备领域的基础和应用研究,分享和发布最新科研动态及研究成果。
 最新文章