GRSM最新综述 | 基于深度学习的遥感道路提取全面综述, 方法模型全汇总

文摘   2025-01-22 00:34   荷兰  

 RS   DL 

论文介绍

题目:Deep Learning-Based Methods for Road Extraction From Remote Sensing Images: A vision, survey, and future directions

期刊:IEEE Geoscience and Remote Sensing Magazine

论文:https://ieeexplore.ieee.org/abstract/document/10826577

年份:2025
单位:烟台大学,人工智能与数字经济广东省实验室,长安大学,加拿大皇家军事学院等

总体介绍

随着遥感和航空航天技术的硬件发展,高分辨率遥感影像在目标特征提取领域的应用变得日益重要。道路作为重要的地理特征,对城市化进程和应急救援具有重要意义。传统的地图更新方法效率低下,而基于遥感影像的道路提取研究越来越受到关注,特别是深度学习方法的应用推动了该领域的快速发展。

本文中道路提取的层次结构分类

数据集

典型数据集

  • Massachusetts Roads Dataset:
    • 年份:2013年
    • 规模:包含1,171幅航拍图像,每幅图像大小为1,500 × 1,500像素。
    • 数据划分:训练集1,108幅,验证集14幅,测试集49幅。
    • 特点:图像覆盖美国马萨诸塞州,常用于验证模型在大规模图像上的性能。
    • DeepGlobe Roads Dataset:
      • 年份:2018年
      • 规模:包含来自泰国、印度和印度尼西亚的图像,像素级标注,图像大小为1,024 × 1,024,分辨率为50 cm/像素。
      • 数据划分:训练集6,226幅,验证集243幅,测试集1,101幅。
      • 特点:测试集无标签,研究者通常将训练集进一步划分。
      • SpaceNet Roads Dataset:
        • 年份:2018年
        • 规模:覆盖拉斯维加斯、巴黎、上海、喀土穆四个地区,包含多种场景,图像大小为200 m × 200 m(650 × 650像素)。
        • 数据划分:训练集占60%,测试集和验证集各占20%。
        • 特点:图像条件一致(如光照、卫星参数等),适合评估模型在多场景下的性能。
        • CHN6-CUG Roads Dataset:
          • 年份:2021年
          • 规模:从Google Earth获取的图像,覆盖六个城市,每幅图像大小为512 × 512像素,分辨率为50 cm/像素。
          • 数据划分:训练集3,608幅,测试集903幅。
          • 特点:选取城市化程度不同的地区,适合研究多样化的道路特征。
          • Gansu Mountain Road Dataset:
            • 年份:2021年
            • 规模:采集自中国甘肃南部山区,共255幅图像,每幅图像大小为256 × 256像素。
            • 数据划分:训练集204幅,验证集40幅,测试集11幅。
            • 特点:适用于评估山区复杂地形下的道路提取性能。

            方法模型

            1. CNN-Based Model

            • 核心特点:卷积神经网络(CNN)以提取影像局部特征为主,擅长捕捉纹理信息。
            • 代表性方法:
              • Minh和Hinton提出结合受限玻尔兹曼机和有限状态机的方法,用于提升局部空间特征。
              • Gao提出改进的深度残差CNN(RDRCNN),结合U-Net的对称结构和残差单元。
              • Wei提出RSRCNN,嵌入几何结构信息以提升提取精度。
            • 局限性:处理复杂背景时易受噪声影响,难以准确提取道路边界。

            2. FCNs-Based Model

            • 核心特点:全卷积网络(FCNs)利用上采样恢复输入图像尺寸,适用于语义分割。
            • 代表性方法:
              • Zhang提出基于多特征的FCN(MFFCN),通过减少冗余计算提升训练效率。
              • Pan通过OpenStreetMap自动生成道路标签,改进了模型泛化能力。
            • 局限性:网络加深后容易丢失细节,受遮挡和光影影响较大。

            3. Encoder–Decoder-Based Model
            • 核心特点:编码器提取特征,解码器逐步恢复图像信息。
            • 代表性方法:
              • LinkNet和U-Net是典型结构,被广泛应用。
              • Zhou提出D-LinkNet,利用膨胀卷积提高道路提取精度。
              • Gu提出MD-LinkNet,结合多通道特征图提高开放矿区道路的提取效果。
            • 优势:保留细节能力较强,适合处理大规模影像。

            4. GAN-Based Model

            • 核心特点:生成对抗网络(GAN)由生成器和判别器组成,用于提升小样本条件下的道路提取性能。
            • 代表性方法:
              • Zhang提出改进的GAN,结合像素级CNN以增强低层特征。
              • Shi基于SegNet设计生成器,实现端到端道路提取。
            • 局限性:处理大规模影像时容易出现梯度消失和模式崩溃问题。

            5. Attention Mechanism-Based Model

            • 核心特点:注意力机制聚焦于关键特征,增强对道路信息的捕获。
            • 代表性方法:
              • Xu提出GL-Dense-U-Net,融合全局和局部注意力模块。
              • Li提出CADUNet,利用核心注意力模块增强道路信息传递。
              • Wan提出DA-RoadNet,利用双注意力机制解决复杂条件下的道路断裂问题。
            • 优势:可有效忽略不相关信息,提高特征提取的精准度。

            6. Feature Fusion-Based Methods

            • 核心特点:通过多尺度特征融合,增强对道路背景信息的提取。
            • 代表性方法:
              • Zhu提出GCB-Net,结合全局上下文感知模块提高模型鲁棒性。
              • Yan改进D-LinkNet的D-Block结构,引入迭代融合节点提升连通性。
            • 优势:在解码阶段有效结合多级特征信息,提高提取精度。

            7. Multitask Learning-Based Methods

            • 核心特点:联合学习道路、边缘和中心线的提取任务,提高模型泛化能力。
            • 代表性方法:
              • Liu提出RoadNet,采用多级特征提取应对复杂场景。
              • Shao提出MRENet,使用PSPooling模块集成多尺度特征信息。
              • Wei引入道路拓扑损失函数,提升道路网络的连通性。
            • 优势:多任务之间的信息共享可提升总体性能。

            8. Multiscale-Based Methods

            • 核心特点:通过多尺度特征学习提升细长或被遮挡道路的提取性能。
            • 代表性方法:
              • Zhang提出GMR-Net,结合全局注意力和多路径膨胀卷积逐步优化细节。
              • Jie提出MECA-Net,设计长程上下文感知模块捕捉足够的远程信息。
            • 优势:适用于复杂场景中多样化道路特征的提取。

            9. Transformer-Based Model

            • 核心特点:Transformer通过自注意力机制捕捉全局和局部信息。
            • 代表性方法:
              • Yang引入Swin Transformer,用窗口注意力模块增强全局信息捕捉能力。
              • Luo提出BDTNet,结合双向Transformer模块提取多尺度特征。
            • 局限性:计算复杂度高,对GPU内存要求较大。

            10. GCN-Based Model

            • 核心特点:图卷积网络(GCN)构造邻接矩阵,通过节点更新保留空间细节。
            • 代表性方法:
              • Zhou提出分离式GCN,结合空间和通道全局信息提升道路特征表征。
              • Cui提出GDCNet,通过多尺度学习增强对遮挡道路的提取能力。
            • 优势:适合处理曲折、细长和被遮挡的道路。

            11. Unsupervised Learning Methods

            • 核心特点:通过最小化原始图像与重构图像的差异,实现特征的无监督提取。
            • 代表性方法:
              • Tao提出URDNN,利用自编码器训练无监督特征提取。
              • 结合监督与无监督方法,提升提取的通用性和准确性。
            • 局限性:性能相比监督学习稍弱,但标注需求更低。

            12. Weakly Supervised Learning Methods

            • 核心特点:通过弱监督信息(如标注涂鸦)减少人工标注工作量。
            • 代表性方法:
              • Zhou提出SOC-RoadNet,通过结构和方向一致性聚合道路特征。
              • Lian基于多点标注设计级联模型,降低标注成本。
            • 趋势:结合GAN与小样本技术,有望进一步降低标注需求。

            讨论

            文章比较了不同遥感影像道路提取模型在Massachusetts和DeepGlobe等数据集上的性能。
            这部分原文对不同类型方法的表现做了详细分析,细节可阅读原文。
            1. Massachusetts Dataset:
            • 输入尺寸通常为512 × 512,以减少大图像(1,500 × 1,500像素)带来的训练不稳定性。
            • 表现最佳的模型:基于编码器-解码器结构(如ICN-DCRF和GMR-Net)和多尺度方法,因其能有效保留空间细节,并通过后处理方法逐步优化道路细节。
          1. DeepGlobe Dataset:
            • 主流模型通常保留了原始图像大小(1,024 × 1,024)作为输入。
            • 表现最佳的模型:改进型D-LinkNet(如NL-LinkNet和RCFSNet),利用预训练ResNet权重加快训练收敛,同时通过多样化注意力机制提升道路连通性和完整性。

              挑战和展望

              挑战
              • 道路特性:道路长度大、边界模糊、不规则,且类型多样(如沥青、土路、砂砾路等)。

              • 干扰因素:建筑遮挡、植被阴影、行人和车辆动态变化对数据采集和分析造成影响。
              展望

              1. 高分辨率遥感道路数据集

                • 解决遥感分割数据集规模小的问题。
                • 开发高质量标注数据集并研究自动标注模型。

              2. Transformer结构

                • 设计适合遥感影像特点的Transformer模型。
                • 强化上下文语义信息捕捉能力。

              3. 半监督与无监督学习

                • 探索利用少量标注和大量未标注数据提升模型性能。
                • 优化语义分割精度,降低人工标注需求。

              4. 轻量化与高效模型

                • 开发快速、精准的轻量化模型,满足实时提取需求。
                • 在提升效率的同时确保提取精度。

              更多图表分析可见原文


              公众号升级版AI回复功能已启用,如需加群、投稿或合作,请微信联系小助手(备注:咨询/投稿/合作/加群,加群需姓名/昵称、单位和研究方向)。
              我们目前有交流群、作者群(已发表成果的作者)、竞赛群和语义分割、变化检测等具体方向的交流群,详见:交流群说明

              公众号欢迎优秀作者投稿!投稿说明请查看:投稿说明

              往期推荐

              TGRS | KDGraph: 关键点检测用于遥感道路提取, 有效减少阴影和遮挡影响!数据代码开源

              2025-01-11

              TGRS | 可变形傅里叶卷积用于遥感道路分割,代码已开源

              2024-11-23

              TGRS | PolyRoad: 北大, 达摩院团队提出道路边界检测的transformer网络

              2024-11-20

              RSE | 刚果盆地道路发展监测, 基于深度学习和多源卫星影像

              2024-10-27


                欢迎关注  


              分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



              欢迎加入遥感与深度学习交流群(点此加入)

              遥感与深度学习
              聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
               最新文章