RS DL
论文介绍
题目:Deep Learning-Based Methods for Road Extraction From Remote Sensing Images: A vision, survey, and future directions
期刊:IEEE Geoscience and Remote Sensing Magazine
论文:https://ieeexplore.ieee.org/abstract/document/10826577
总体介绍
数据集
典型数据集
Massachusetts Roads Dataset:
年份:2013年 规模:包含1,171幅航拍图像,每幅图像大小为1,500 × 1,500像素。 数据划分:训练集1,108幅,验证集14幅,测试集49幅。 特点:图像覆盖美国马萨诸塞州,常用于验证模型在大规模图像上的性能。
DeepGlobe Roads Dataset:
年份:2018年 规模:包含来自泰国、印度和印度尼西亚的图像,像素级标注,图像大小为1,024 × 1,024,分辨率为50 cm/像素。 数据划分:训练集6,226幅,验证集243幅,测试集1,101幅。 特点:测试集无标签,研究者通常将训练集进一步划分。
SpaceNet Roads Dataset:
年份:2018年 规模:覆盖拉斯维加斯、巴黎、上海、喀土穆四个地区,包含多种场景,图像大小为200 m × 200 m(650 × 650像素)。 数据划分:训练集占60%,测试集和验证集各占20%。 特点:图像条件一致(如光照、卫星参数等),适合评估模型在多场景下的性能。
CHN6-CUG Roads Dataset:
年份:2021年 规模:从Google Earth获取的图像,覆盖六个城市,每幅图像大小为512 × 512像素,分辨率为50 cm/像素。 数据划分:训练集3,608幅,测试集903幅。 特点:选取城市化程度不同的地区,适合研究多样化的道路特征。
Gansu Mountain Road Dataset:
年份:2021年 规模:采集自中国甘肃南部山区,共255幅图像,每幅图像大小为256 × 256像素。 数据划分:训练集204幅,验证集40幅,测试集11幅。 特点:适用于评估山区复杂地形下的道路提取性能。
方法模型
1. CNN-Based Model
核心特点:卷积神经网络(CNN)以提取影像局部特征为主,擅长捕捉纹理信息。 代表性方法:
Minh和Hinton提出结合受限玻尔兹曼机和有限状态机的方法,用于提升局部空间特征。 Gao提出改进的深度残差CNN(RDRCNN),结合U-Net的对称结构和残差单元。 Wei提出RSRCNN,嵌入几何结构信息以提升提取精度。
局限性:处理复杂背景时易受噪声影响,难以准确提取道路边界。
2. FCNs-Based Model
核心特点:全卷积网络(FCNs)利用上采样恢复输入图像尺寸,适用于语义分割。 代表性方法:
Zhang提出基于多特征的FCN(MFFCN),通过减少冗余计算提升训练效率。 Pan通过OpenStreetMap自动生成道路标签,改进了模型泛化能力。
局限性:网络加深后容易丢失细节,受遮挡和光影影响较大。
核心特点:编码器提取特征,解码器逐步恢复图像信息。 代表性方法:
LinkNet和U-Net是典型结构,被广泛应用。 Zhou提出D-LinkNet,利用膨胀卷积提高道路提取精度。 Gu提出MD-LinkNet,结合多通道特征图提高开放矿区道路的提取效果。
优势:保留细节能力较强,适合处理大规模影像。
4. GAN-Based Model
核心特点:生成对抗网络(GAN)由生成器和判别器组成,用于提升小样本条件下的道路提取性能。
代表性方法: Zhang提出改进的GAN,结合像素级CNN以增强低层特征。 Shi基于SegNet设计生成器,实现端到端道路提取。
局限性:处理大规模影像时容易出现梯度消失和模式崩溃问题。
5. Attention Mechanism-Based Model
核心特点:注意力机制聚焦于关键特征,增强对道路信息的捕获。 代表性方法:
Xu提出GL-Dense-U-Net,融合全局和局部注意力模块。 Li提出CADUNet,利用核心注意力模块增强道路信息传递。 Wan提出DA-RoadNet,利用双注意力机制解决复杂条件下的道路断裂问题。
优势:可有效忽略不相关信息,提高特征提取的精准度。
6. Feature Fusion-Based Methods
核心特点:通过多尺度特征融合,增强对道路背景信息的提取。 代表性方法:
Zhu提出GCB-Net,结合全局上下文感知模块提高模型鲁棒性。 Yan改进D-LinkNet的D-Block结构,引入迭代融合节点提升连通性。
优势:在解码阶段有效结合多级特征信息,提高提取精度。
7. Multitask Learning-Based Methods
核心特点:联合学习道路、边缘和中心线的提取任务,提高模型泛化能力。 代表性方法:
Liu提出RoadNet,采用多级特征提取应对复杂场景。 Shao提出MRENet,使用PSPooling模块集成多尺度特征信息。 Wei引入道路拓扑损失函数,提升道路网络的连通性。
优势:多任务之间的信息共享可提升总体性能。
8. Multiscale-Based Methods
核心特点:通过多尺度特征学习提升细长或被遮挡道路的提取性能。 代表性方法:
Zhang提出GMR-Net,结合全局注意力和多路径膨胀卷积逐步优化细节。 Jie提出MECA-Net,设计长程上下文感知模块捕捉足够的远程信息。
优势:适用于复杂场景中多样化道路特征的提取。
9. Transformer-Based Model
核心特点:Transformer通过自注意力机制捕捉全局和局部信息。 代表性方法:
Yang引入Swin Transformer,用窗口注意力模块增强全局信息捕捉能力。 Luo提出BDTNet,结合双向Transformer模块提取多尺度特征。
局限性:计算复杂度高,对GPU内存要求较大。
10. GCN-Based Model
核心特点:图卷积网络(GCN)构造邻接矩阵,通过节点更新保留空间细节。 代表性方法:
Zhou提出分离式GCN,结合空间和通道全局信息提升道路特征表征。 Cui提出GDCNet,通过多尺度学习增强对遮挡道路的提取能力。
优势:适合处理曲折、细长和被遮挡的道路。
11. Unsupervised Learning Methods
核心特点:通过最小化原始图像与重构图像的差异,实现特征的无监督提取。 代表性方法:
Tao提出URDNN,利用自编码器训练无监督特征提取。 结合监督与无监督方法,提升提取的通用性和准确性。
局限性:性能相比监督学习稍弱,但标注需求更低。
12. Weakly Supervised Learning Methods
核心特点:通过弱监督信息(如标注涂鸦)减少人工标注工作量。 代表性方法:
Zhou提出SOC-RoadNet,通过结构和方向一致性聚合道路特征。 Lian基于多点标注设计级联模型,降低标注成本。
趋势:结合GAN与小样本技术,有望进一步降低标注需求。
讨论
Massachusetts Dataset:
输入尺寸通常为512 × 512,以减少大图像(1,500 × 1,500像素)带来的训练不稳定性。 表现最佳的模型:基于编码器-解码器结构(如ICN-DCRF和GMR-Net)和多尺度方法,因其能有效保留空间细节,并通过后处理方法逐步优化道路细节。
主流模型通常保留了原始图像大小(1,024 × 1,024)作为输入。 表现最佳的模型:改进型D-LinkNet(如NL-LinkNet和RCFSNet),利用预训练ResNet权重加快训练收敛,同时通过多样化注意力机制提升道路连通性和完整性。
挑战和展望
道路特性:道路长度大、边界模糊、不规则,且类型多样(如沥青、土路、砂砾路等)。
干扰因素:建筑遮挡、植被阴影、行人和车辆动态变化对数据采集和分析造成影响。
1. 高分辨率遥感道路数据集
解决遥感分割数据集规模小的问题。 开发高质量标注数据集并研究自动标注模型。
2. Transformer结构
设计适合遥感影像特点的Transformer模型。 强化上下文语义信息捕捉能力。
3. 半监督与无监督学习
探索利用少量标注和大量未标注数据提升模型性能。 优化语义分割精度,降低人工标注需求。
4. 轻量化与高效模型
开发快速、精准的轻量化模型,满足实时提取需求。 在提升效率的同时确保提取精度。
更多图表分析可见原文
公众号欢迎优秀作者投稿!投稿说明请查看:投稿说明
2025-01-11
2024-11-23
2024-11-20
2024-10-27
欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。