最新论文 | DenoDet: SARDet-100K目标检测榜单最优模型, 基于频域特征动态去噪, 代码开源!

文摘   2025-02-03 09:44   荷兰  

 RS   DL 

论文介绍

题目:DenoDet: Attention as Deformable Multi-Subspace Feature Denoising for Target Detection in SAR Images

勘误:期刊名和链接有误,详见留言区//:ISPRS Journal of Photogrammetry and Remote Sensing

/论文:https://doi.org/10.1016/j.isprsjprs.2024.12.024

年份:2025

单位:南京理工大学,南京邮电大学,南开大学
注:本篇部分内容经论文原作者联系后转自GrokCV公众号

主要贡献

  • 在深度网络中嵌入离散余弦变换,通过频域信息进行自适应去噪
  • 采用分组方式处理频域信息,保证每组同时包含高、低频信号
  • 通过自适应策略采样,让网络自动学习最优的频率分组方式

数据


  • MSAR(HISEA-1 卫星)

    • 4 类目标:船舶、油罐、飞机、桥梁

    • 共 60,396 个目标实例

    • 主要挑战:斑点噪声干扰严重,小目标较多

  • SAR-Aircraft-1.0(Gaofen-3 卫星)

    • 7 种飞机类型(如 A220、A320、Boeing737 等)

    • 共 16,463 个目标

    • 主要挑战:飞机目标小,背景复杂

  • AIR-SARShip-1.0(Gaofen-3 卫星)

    • 31 组大场景 SAR 图像

    • 512 个船舶目标

    • 主要挑战:天气条件多变,目标易受噪声影响

  • SARDet-100K(多个卫星 & 机载 SAR)

    • 116,598 张图像,245,653 个目标

    • 6 类目标:飞机、船舶、汽车、桥梁、坦克、港口

    • 主要挑战:规模大,跨平台、多分辨率、多场景

      图 1. 相关数据集

背景


SAR 图像检测面临的问题

SAR 图像目标检测具有广泛应用,但由于 SAR 的成像方式和目标特性, 其在实际应用中面临诸多挑战,其中主要包括两个方面: 相干噪声干扰 及 小目标难以准确检测
相干噪声干扰
SAR 图像利用相干成像技术获取目标信息,而这一成像机制不可避免地带来了显著的相干噪声 [2]如图 4 所示,现有的公开 SAR 数据集,如 SARDet-100K、 MSAR、SAR-AIRcraft-1.0 和 AIR-SARShip,其数据中都包含显著的相干噪声。

相干噪声是一种乘性噪声,由成像过程中信号相位误差引起,其具体表现为图像中随机分布的明暗区域。由于乘性相干噪声会随着信号本身的强弱发生变化,故 SAR 图像中的噪声经常严重遮盖目标的形状轮廓和纹理特征。

小目标检测

由于大多数 SAR 成像平台位于天基轨道,SAR 图像中的目标通常尺寸相对较小, 并且不同目标间的像素尺度差异巨大。例如,在 SARDet-100K 数据集中,图像宽度分布在 190 至 1000 像素之间, 但舰船目标的最小宽度仅为 9 个像素;AIR-SARShip 数据集虽将图像大小固定为 3000×3000 像素, 舰船目标的像素尺度却可在 5 至 277 之间波动。
小目标的存在使检测面临严峻挑战。尤其在 SAR 图像中,噪声往往会掩盖目标形状和特征信息,从而进一步削弱模型对目标区域的准确捕捉能力。

现有深度学习方法的不足

尽管近年来深度学习技术引领了目标检测领域的飞速发展,但现有的检测网络设计仍主要面向通用自然图像。由于 SAR 的成像机制与自然图像相差甚远,现有方法应用于 SAR 图像时,效果往往不及预期。造成这一现象的原因包括:
  • 无法自适应去噪强度
    自然图像中常见的加性噪声往往可以通过滤波算法或减去固定值来消除。而 SAR 图像中的乘性噪声会随着信号本身强度的变化而变化, 使用硬阈值去噪算法很容易将目标的有效特征一并抑制,导致信号的结构特征被破坏,从而引发漏检和虚警。
  • 极小目标检测困难
    SAR 数据集中广泛存在的极小目标为检测带来了新的难题。特别是当目标被噪声覆盖时,其形状特征难以在深度网络的高层特征中保留,进一步削弱了模型的检测能力。
  • 卷积神经网络的低频偏好
    深度网络中常用的卷积操作对高频信号表现出天然的弱敏感性 [3], 而目标的细节信息和 SAR 图像中的噪声信号往往包含于高频信息中,这种低频偏好使现有模型难以充分利用高低频特征来有效区分噪声和目标。

相关工作

针对 SAR 图像目标检测中存在的问题,一些研究进行了针对性的设计,包括:
  • CFAR(恒虚警率检测)[4][5][6]:通过调整检测阈值来保证恒定的虚警率,从而在不同的噪声背景下提高检测精度。

  • 软阈值去噪 [7][8][9]:在频域中对高频分量设定阈值,保留信号的主要信息,同时抑制噪声的影响。

  • 注意力机制 [10][11][12]:将图像的全局语义信息与特征信息进行融合,突出目标区域的特征点,减少噪声干扰。

研究动机

尽管上述方法在一定程度上提升了 SAR 图像目标检测的性能,但仍有诸多亟待解决的问题。其中,去噪强度的确定始终是一个关键难点:预设滤波算法难以自适应地调整去噪力度,去噪力度过强会抑制目标有效特征并导致漏检,去噪力度过弱则无法高效过滤噪声而造成虚警。由于 SAR 图像中噪声与信号的复杂关系,单一固定的去噪策略难以在所有场景下取得理想效果。
此外,在去噪的同时有效凸显小目标特征也是不容回避的挑战。注意力机制虽然能捕获全局语义信息、突出目标特征并减少噪声干扰,但其更倾向于处理低频信号, 而 SAR 图像中目标细节信息多集中在高频部分,相干噪声也主要分布在高频分量。高频信息难以在现有方法中得到足够的关注,导致自适应去噪能力受限。
换言之,现有方法无法根据信号强弱动态调整去噪强度,与 SAR 图像的成像特点并不完全契合。因此,在去噪过程中平衡高频信息的保留与优化,以及充分利用噪声中的有效细节特征,依旧是 SAR 图像目标检测领域需要面对的核心难题。
基于这一思路,本文从域变换算法中获得启发,提出了针对 SAR 图像特征的目标检测算法 DenoDet—— 基于频域特征动态去噪的 SAR 图像目标检测算法。离散余弦变换(Discrete Cosine Transform, DCT)能够将信号从时域(图像上的空间域)转换到频域, 为提取并分离图像的高低频信息特征提供了天然优势。此外,在离散余弦变换后的 SAR 图像频域特征图中,信号呈现出从左到右、从上到下频率逐渐升高的规律性分布特性。这一 DCT 的自然属性使得频域信号具备可控的空间分布规律,有助于高低频信息之间灵活调整交互范围。

图 2. DCT 示例

方法


图 3. DenoDet 网络结构

研究提出了一种全新的目标检测模型 —— 基于特征去噪的检测框架 (DenoDet),如图所示。该框架通过离散余弦变换 (DCT) 将时空域特征投射至频率域,实现对高、低频信息的显式分离, 从而引导网络针对高频成分进行自适应去噪。DenoDet 的主要贡献包括以下三个方面:

・在深度网络中嵌入离散余弦变换,通过频域信息进行自适应去噪;
・采用分组方式处理频域信息,保证每组同时包含高、低频信号;
・通过自适应策略采样,让网络自动学习最优的频率分组方式。

在 DenoDet 的处理流程中,首先对特征图执行 DCT 转换,将其映射到频域, 在对频域信号进行调制的过程中,观察到高、低频特征可互相补充,从而协同抑制噪声。基于此,首先通过分组卷积将频域信号划分成若干等尺寸的信号块,确保每块均衡涵盖高、低频成分。然而,如何选择合适的分组策略,使得高、低频特征在充分交互的同时实现有效去噪,仍是一项挑战。为此,研究设计了自适应分组采样策略,让网络能够自动搜索最优的分组方式。通过调整线性层分组数量来限定信号的频率交互范围, 确保每个信号块单元都能动态选择一定比例的高、低频特征,从而进一步增强去噪和特征提取能力。

整体而言,DenoDet 首先将主干网络输出的特征图转换到频域;随后,对频域特征进行通道平均池化和最大池化融合以提取特征图谱,并采用分组卷积完成高低频特征的交互;接着,利用额外的线性层生成索引量,对分组策略进行动态插值;最后,将初始频域信号与高低频交互后的特征图进行点乘来完成去噪, 并通过离散余弦反变换回到空间域,得到更干净的特征图。

结果与分析

定量对比实验
如表所示,在 SARDet-100K、SAR-AIRcraft 1.0 和 MSAR 这三个基准数据集上对 DenoDet 进行了全面的性能比较和评估,实验结果证明了 DenoDet 的 SOTA 性能。

表 1. DenoDet 在 SARDet-100K 上的表现

表 2. DenoDet 在 SAR-AIRcraft-1.0 上的表现

表 3. DenoDet 在 MSAR 上的表现

特征图去噪效果可视化

研究对网络中 SAR 图像的特征图进行了归一化处理并可视化,结果如图所示。可以看到,经过 DenoDet 去噪后,目标区域在特征图中以更深的颜色得到了突出,而背景与噪声区域则呈现更浅、更 “干净” 的色调。这表明网络能够更有效地捕捉目标特征,并屏蔽背景噪声。进一步佐证了 DenoDet 在 SAR 图像目标检测任务中的优异性能。

结论和未来工作

DenoDet 对将频域去噪用于 SAR 图像检测进行了初步探索。其利用离散余弦变换来实现高、低频信号的显式分离与交互,并通过分组卷积、可变形分组策略等结构在频域内实现自适应去噪。
然而,仍有许多潜在研究方向值得深入,包括如何高效地划分频域子空间、如何同时利用幅度与相位信息、如何实现多维度频域交互,以及如何将基于频域去噪的检测框架推广到更多目标检测场景。团队将在这些方面继续深化研究,期待与更多同仁展开讨论与合作。

参考文献

[1]: Chi Zhang, Xi Zhang, Gui Gao, Haitao Lang, Genwang Liu, Chenghui Cao. Development and Application of Ship Detection and Classification Datasets: A reviewIEEE Geoscience and Remote Sensing Magazine, doi: 10.1109/MGRS.2024.3450681.

[2]: Dong-Xiao Yue, Feng Xu, Alejandro C. Frery and Ya-Qiu Jin. Synthetic Aperture Radar Image Statistical Modeling: Part One-Single-Pixel Statistical ModelsIEEE Geoscience and Remote Sensing Magazine, vol. 9, no. 1, pp. 82-114, March 2021.

[3]: Zhi-Qin John Xu, Yaoyu Zhang, and Tao Luo. Overview frequency principle/spectral bias in deep learningCoRR, vol. abs/2201.07395, 2022.

[4]: Chao Wang, Baolong Guo, jiawei Song, Fangliang He and Cheng Li. A Novel CFAR-Based Ship Detection Method Using Range-Compressed Data for Spaceborne SAR SystemIEEE Transactions on Geoscience and Remote Sensing, vol. 62, pp. 1-15, 2024.

[5]: Pucheng Li, Zegang Ding, Tianyi Zhang, Yangkai Wei and Yongpeng Gao. Integrated Detection and Imaging Algorithm for Radar Sparse Targets via CFAR-ADMMIEEE Transactions on Geoscience and Remote Sensing, vol. 61, pp. 1-15, 2023.

[6]: Tao Liu, Ziyuan Yang, Gui Gao, Armando Marino and Si-Wei Chen. Simultaneous Diagonalization of Hermitian Matrices and Its Application in PolSAR Ship DetectionIEEE Transactions on Geoscience and Remote Sensing, vol. 61, pp. 1-18, 2023.

[7]: Chuan Zhang, Gui Gao, Jia Liu and Dingfeng Duan. Oriented Ship Detection Based on Soft Thresholding and Context Information in SAR Images of Complex ScenesIEEE Transactions on Geoscience and Remote Sensing vol. 62, pp. 1-15, 2024.

[8]: Mingxiao Shao, Zhe Zhang, Jie Li, Jian Kang and Bingchen Zhang. TADCG: A Novel Gridless Tomographic SAR Imaging Approach Based on the Alternate Descent Conditional Gradient Algorithm With Robustness and EfficiencyIEEE Transactions on Geoscience and Remote Sensing, vol. 62, pp. 1-13, 2024.

[9]: Lei Yang, Minghui Gai, Tengteng Wang and Mengdao Xing. Elaborated-Structure Awareness SAR Imagery Using Hessian-Enhanced TV RegularizationIEEE Transactions on Geoscience and Remote Sensing, vol. 61, pp. 1-16, 2023.

[10]: Yuxuan Li, Qibin Hou, zhaohui Zheng, Ming-Ming Cheng, Jian Yang, and Xiang Li. Large selective kernel network for remote sensing object detectionIEEE International Conference on Computer Vision, 2023, pp. 16 794– 16 805.

[11]: Yuning Cui, Yi Tao, Wenqi Ren, and Alois Knoll. Dual-domain attention for image deblurringAAAI Conference on Artificial Intelligence, B. Williams, Y. Chen, and J. Neville, Eds., 2023, pp. 479–487.

[12]: Zequn Qin, Pengyi Zhang, Fei Wu, and Xi Li. FCANet: Frequency channel attention networksIEEE International Conference on Computer Vision, 2021, pp. 763–772.


更多图表分析可见原文


众号升级版AI回复功能已启用,如需加群、投稿或合作,请微信联系小助手(备注:咨询/投稿/合作/加群,加群需姓名/昵称、单位和研究方向)。

我们目前有交流群、作者群(已发表成果的作者)、竞赛群和语义分割、变化检测等具体方向的交流群,详见:交流群说明

公众号欢迎优秀作者投稿!投稿说明请查看:投稿说明

往期推荐

数据论文 | SARDet-100K: 首个 COCO 级别的大型 SAR 目标检测数据集

2024-09-12

TIP/ISPRS|国防科大刘永祥和刘丽教授团队提出首个公开发表的SAR图像目标识别基础模型SARATR-X 1.0

2025-01-17

GRSM顶刊综述 | 全面总结SAR在城市洪水制图中的应用

2024-12-17


  欢迎关注  


分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



欢迎加入遥感与深度学习交流群(点此加入)

遥感与深度学习
聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
 最新文章