RS DL
论文介绍
主要内容
背景与重要性:城市土地利用分类对于理解城市环境动态和推动可持续发展至关重要。随着遥感技术和地理空间大数据的迅速发展,深度学习在该领域展现出巨大的潜力,能够提高分类的规模、准确性、效率和自动化水平。
研究内容:本文回顾了基于深度学习的城市土地利用分类研究,讨论了数据来源、分类单元和深度学习方法。同时,文章在中国深圳地区设计了八组实验,评估不同模型在分类任务中的表现,考察了数据类型、样本大小和模型参数配置对分类性能的影响。
数据与方法:实验采用了高分辨率的遥感数据(如WorldView、Sentinel-2)和社会感知数据(如Gaode POI数据、WorldPop人口数据),结合多种深度学习模型(如MobileNet、ResNet、Vision Transformer)进行城市土地利用分类。
主要发现: 深度学习模型在城市土地利用分类中的表现明显优于传统方法,尤其是在提取复杂的地理与社会经济属性信息方面。
通过整合多源数据,模型的分类精度显著提升。MobileNet和WideResNet模型表现突出,取得了较高的分类精度。
不同模型在处理不同类型数据时的表现存在差异,并且模型的复杂性与训练数据量之间存在权衡。
未来方向:文章指出了当前城市土地利用分类面临的挑战,包括多模态数据融合、模型的扩展性和自动化水平,并提出未来可以在多源数据整合、模型优化以及跨区域泛化能力方面继续深入探索。
深度学习在土地利用分类中的进展
1 数据源 (Data sources)
该部分总结了在使用深度学习进行城市土地利用分类时常用的数据源,主要分为遥感数据和社交感知数据两大类。
遥感数据 (Remote sensing):
多光谱遥感 (Multispectral remote sensing):通过不同波段反射的信息来区分水体、植被、土壤和建筑区域等主要的地表覆盖物。 高光谱遥感 (Hyperspectral remote sensing):通过更细致的波段信息对材料和物理属性进行精确识别。 夜间灯光遥感 (Nighttime light remote sensing):用于观察人类活动的夜间灯光,常用于监测城市活动和社会经济动态。 微波遥感 (Microwave remote sensing):利用合成孔径雷达(SAR)等技术,能够在全天候、所有气象条件下捕捉地表信息。 激光雷达 (LiDAR):通过脉冲激光测量距离,获取地物的三维结构信息,常用于提取城市建筑物的高度、形状等信息。
社交感知数据 (Social sensing):
社交媒体数据 (Social media data):包括来自社交媒体平台的地理标记数据、图像、文本等,能反映用户的空间行为和活动模式。 移动设备数据 (Mobile device data):通过手机信令、GPS轨迹等数据捕捉人类的移动和社会活动信息。 近程感知 (Proximate sensing):如街景图像、车辆记录数据,提供了近距离观察城市功能的详细信息。 志愿地理信息 (Volunteered geographic information, VGI):如开放街图(OpenStreetMap)等用户生成的地理信息,广泛用于表示城市功能。
2 分类单元 (Mapping units)
分类单元决定了分类的空间尺度和分辨率。文章中介绍了三种常见的分类单元:
像素级单元 (Pixel-level units):最基础的分类单元,适用于大范围的地表分类,但在城市复杂环境中容易受到类内差异和类间相似的影响。 对象级单元 (Object-level units):基于遥感影像中的对象(如建筑物、街区)进行分类,常用于提高分类精度,但难以推广到大规模应用。 场景级单元 (Scene-level units):代表由人类解读的特定区域,如街区、交通分析区,适合反映复杂的城市功能和社会经济特征。
3 深度学习的分类方法 (Deep learning-based approaches)
文章详细介绍了多种深度学习模型在土地利用分类中的应用:
多层感知器 (MLP):作为神经网络的基础模型,MLP可以对输入特征进行有效的高阶表征,但在处理复杂任务时较弱。
卷积神经网络 (CNN):CNN通过卷积层提取图像中的局部特征,特别适合处理遥感影像,在土地利用分类中取得了广泛应用。扩展的全卷积网络(FCN)进一步提升了像素级分类能力。
循环神经网络 (RNN):RNN擅长处理时间序列数据,被用于提取遥感影像的时间变化特征,如土地覆盖变化等。
生成对抗网络 (GAN):GAN在土地利用分类中用于生成高分辨率遥感影像以及处理数据不平衡问题,提升了分类模型的泛化能力。
Transformer和图神经网络 (GNN):这两种模型逐渐引入土地利用分类任务,Transformer擅长处理长距离依赖关系,GNN能够建模复杂的空间拓扑关系。
深度学习与传统机器学习比较
4 多模型集成 (Multi-model ensemble)
为了进一步提升分类效果,研究人员提出了将多个模型进行集成的方案,主要分为两类:
DL与非DL集成:通过将深度学习模型与传统机器学习模型(如随机森林、支持向量机)结合,充分利用各自的优势,提升分类精度。 DL与DL集成:通过组合不同深度学习模型处理多模态数据(如遥感影像与社交感知数据),提高模型对复杂城市功能的识别能力。
实验评估
1 研究区域
文章选择深圳作为实验区域,深圳市具有复杂的经济结构和多样化的人口分布,是城市土地利用分类的理想测试地点。实验使用了来自深圳市的多源数据,包括卫星图像、POI数据、人口数据等,实验评估了不同深度学习模型在城市土地利用分类中的表现。
2 实验设计
作者设计了八组实验,旨在探讨不同数据配置对分类性能的影响:
不同数据源:不同类型的输入数据(遥感数据和辅助数据)对模型性能的影响。遥感数据包括不同分辨率的影像,如0.5米的WorldView影像、3米的PlanetScope影像、10米的Sentinel-2影像等。辅助数据包括Gaode POI数据、人口数据和建筑高度数据。 不同AI模型:比较了多种AI模型(从浅层学习到深度学习)在城市土地利用分类中的优缺点。涉及的模型包括VGGNet、ResNet、WideResNet、DenseNet、MobileNet、MLP、LSTM、ViG和ViT等。此外,实验还对比了使用和不使用预训练权重的模型表现。 不同图像块大小:实验通过不同大小的图像块来训练模型,评估这些块的大小对分类性能的影响。图像块被重新采样为32、64、96、128等不同尺寸,用于训练和测试深度学习模型。 训练样本和测试样本数量:实验通过减少训练样本和测试样本的比例,探讨样本数量对模型性能的影响。训练样本从100%减少到1%,以评估训练样本数量对分类精度的影响。 不同数据输入策略:探讨了三种数据输入策略的影响:(1)仅使用地块内部的像素数据,(2)使用包含地块外部区域的影像,(3)结合地块的二值掩码与影像输入。 空间迁移性:研究了模型在城市不同区域的迁移性表现。实验选取了深圳的三个区域(原经济特区、原宝安区和原龙岗区),评估模型在这些区域之间的分类性能。 不同地块层级的影响:通过不同层级的地块训练模型,评估不同地块分割尺度对分类的影响。 地块纯度:研究了地块纯度(即某一地块中主要土地利用类型所占的比例)对分类模型性能的影响。地块被分为高纯度(纯度大于90%)、中纯度(纯度60%至90%)和低纯度(纯度低于60%)三类,分别训练模型并在不同纯度的测试集上进行验证。
八组实验:
数据源
3 结果与讨论
不同输入数据源和特征
深度学习和传统方法的表现
不同重采样尺度下的多尺度样本分类准确率和计算时间成本
不同的训练数据比例
不同地块层级上的性能
地块纯度的影响
结果表明:使用高纯度数据集训练的模型在所有测试条件下普遍表现更好
注:更多图表信息可查看全文
欢迎关注CVPR 2024系列
因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询、投稿、合作、加群,加群需备注姓名/昵称,单位和研究方向)。
关于AI回复功能:
公众号新增AI回复功能,已接入大模型,集成查找ArXiv论文、CSDN博文等功能
问题及讨论可直接在文章下方留言
相关链接:
欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。