又创新?U-KAN:专注图像边界细节优化的网络架构!

文摘   2024-08-29 18:27   江苏  

U-KAN网络架构是一种创新性的深度学习框架,它将Kolmogorov-Arnold网络(KAN)与经典的U-Net架构巧妙地融合,旨在提升图像分割和生成任务的效率准确性

论文链接:https://www.arxiv.org/abs/2408.07040

github链接:https://github.com/DarthReca/crop-field-segmentation-ukan



U-Net架构简介




U-Net是一种专为生物医学图像分割设计的卷积神经网络架构,其显著特点是其独特的U形结构

该结构包含两个主要部分:

  • 用于捕获图像上下文信息的收缩路径(也称为编码路径)

  • 用于恢复图像分辨率并实现精确分割的扩展路径(也称为解码路径)



U-Kan架构简介


KANs(Kolmogorov-Arnold Networks)是依据Kolmogorov-Arnold表示定理设计的一种前沿神经网络架构。

该定理指出,任何定义在区间上的多元连续函数f,都可以被表达为一系列单变量连续函数的双参数加法的叠加,并经过另一组单变量函数的变换。


与在传统多层感知机(MLPs)中节点上采用固定激活函数不同,KANs(可学习激活网络)在边上采用了可学习的激活函数这是通过将每个线性权重参数替换为带样条为的单变量函数来实现的。训练过程中,激活函数逐步变化,以更好地逼近期望的目标,同时KANs提供了可视化这些可学习激活函数的可能性。对编码器最后几层和解码器前几层的修改允许网络学习自定义的激活函数而不是固定的激活函数,在需要时通过学习简单的激活函数来减少所需的计算资源。



实验结果


#数据集

使用数据集包含哨兵2号和哨兵1号拍摄的图像,覆盖了南非的广大地区。该数据集包括小型和不规则形状的作物田,并提供比覆盖该地区的其他数据集更高分辨率的图像(大小为256 ×256)。注释为区分耕地和非耕地。

#U-Net与U-KAN在Sentinel-2影像图中的对比

南非的哨兵2号示例图像.(a):RGB格式的哨兵2号图像;(b):地面真值,待分割的作物农田区域以黄色突出显示;(c)、(d):分别是由U-Net和U-KAN生成的显著性图,其中红色像素表示网络高度集中的区域


图中,红色像素标记了网络最为聚焦的区域,凸显了两模型在行为模式上的差异。


具体而言,(c)表明,U-Net模型的关注区域显著大于U-KAN模型,暗示了U-Net在处理分割任务时倾向于将注意力分散到更广阔的区域。与此相反,U-KAN模型主要聚焦于农田边界而非农田内部这种对边界的特别强调表明了U-KAN模型在描绘感兴趣区域边缘时的优先级

#不同波段对分割结果的影响

U-KAN的每通道相关性示例。图像(a):原始RGB的地面真值;图(b):所有12个通道图;图(c)、(d)、(e)分别显示了遮蔽B01、B06、B11对应通道生成的图。

U-KAN网络在遮挡Sentinel-2影像的B01、B06及B11波段相关联的特定通道后,图所发生的显著性变化。

(c)表明,当B01波段被遮挡,得到的显著性图与原始图(b)高度相似,反映出该通道对模型焦点的影响相对有限。相比之下,当对B11波段进行遮挡时,显著性图几乎失去了所有特定区域的关注焦点,这表明若缺少该通道信息,网络将无法有效识别并分割目标特征。

#U-Kan与U-Net的精度对比

U-KAN相较于U-Net,展现出了更高的交并比(IoU)和精度。表明U-KAN能够提供更精确的解释,其输出与人类的理解更为贴近。

另一方面,U-Net则以其较高的召回率和F1可信度得分较高,这可能是由于U-Net在显著性图中对特征的捕捉更为敏感和广泛,尽管这一特性也伴随着误报率的增加。

#不同波段的相关性评估

针对U-KAN与U-Net模型,发现B05(705nm,红边波段)、B8A(865nm,近红外波段)及B11(1610nm,短波红外波段)所对应的通道,由于该波段范围对特定植被特征的捕捉能力,被认定为作物分割任务中最具重要性的通道。

B05波段对叶绿素含量敏感,可用于反映植被的健康状况;

B8A波段与植被生物量密切相关,有助于评估植被的茂盛程度;

B11波段对土壤和植被的含水量高度敏感,为区分不同作物类型和生长条件提供了重要信息。



结论


这项工作中,展示了新的KANs(可学习激活网络)如何改进应用于农业领域的知名架构,特别是在效率方面,仅使用全卷积神经网络(CNN)架构一半的资源

研究表明,U-KAN在达到比U-Net更高的精度和交并比(IoU)分数方面表现出优越的性能。

可解释性分析还揭示了两个重要的见解:

· U-KAN网络对边界细节的强调使其特别适用于边界界定和映射等任务;

· 并非所有通道都对分割任务有用,研究者可以选择仅依赖最重要的通道来降低模型的计算成本。

槿墨AI
产品服务

结合大模型通用知识及在交通、社会治理、安全生产、自然资源等行业领域的知识,深入业务场景,精确捕获用户意图,为用户提供智能问答、数据分析、报表生成、工作任务理解与执行等一系列服务

📞若您有相关需求,欢迎点击下方链接与我们沟通洽谈

🗨️也可以在公众号后台给我们留言


槿墨AI
开启探索人类未来命运的旅程,拥抱如槿似墨的无限可能。
 最新文章