TGRS | UBCV2:全球建筑检测和细粒度分类数据集, 光学和SAR影像精准对齐

文摘   2024-11-16 09:18   荷兰  

 RS   DL 

论文介绍

题目:Urban Building Classification (UBC) V2—A Benchmark for Global Building Detection and Fine-Grained Classification From Satellite Imagery

期刊:IEEE Transactions on Geoscience and Remote Sensing

论文:https://ieeexplore.ieee.org/document/10237272

年份:2024
单位:中科院空天院等

创新点

  • 全球多模态建筑检测与细粒度分类基准数据集:提供了一个包含20个城市、跨越五大洲的高分辨率遥感影像数据集(UBC V2),标注了499,339个建筑实例,包括12种细粒度屋顶类型。数据集首次融合了光学影像和SAR影像(17个城市),实现了两种模态的精确对齐。
  • 细粒度屋顶分类:定义了12种屋顶类型,结合了几何特征和遥感数据特点,提供了更精细的建筑分类基础。
  • 几何特征编码模块(CGT):提出了一个类特定几何transformer模块,通过捕获建筑的几何特征(如边缘、线条和形状),提升了细粒度分类的性能。

数据

1. 数据集概况

Urban Building Classification (UBC) V2覆盖 全球20个城市,分布于五大洲,代表了不同的建筑风格和空间分布类型。包含 499,339个建筑实例,每个建筑用多边形标注,分类为12种屋顶类型。提供光学影像和多模态影像(光学 + SAR)的组合。

2. 地理覆盖
城市分布:
  • 城市包括北京、慕尼黑、巴塞罗那、东京、圣路易斯等,覆盖五大洲。

  • 数据集确保了建筑在外观(例如材料和风格)和空间分布(例如密集程度和排列方式)上的多样性。

  • 每个城市包含了从商业区、高密度居民区到工业区和城郊的建筑样本。

多样性:
  • 数据集中建筑的空间排列从稀疏(如别墅区)到高度密集(如巴塞罗那的城市块)。

  • 屋顶风格的分类涵盖了典型的全球建筑特征,例如平屋顶、双坡屋顶、拱形屋顶等。

3. 数据来源
  • 光学影像:来自中国高分二号(GaoFen-2)和SuperView-1卫星,地面分辨率为0.5米(通过全色锐化)。

  • SAR影像:来自中国高分三号(GaoFen-3)卫星,提供C波段单极化SAR影像。分辨率:1米(通过重采样至0.5米以与光学影像一致)。

  • 多模态对齐:对17个城市提供了光学和SAR影像的精确几何对齐。

4. 数据处理与标注
  • 标注过程:使用OpenStreetMap(OSM)、Google Maps等高质量数据源为参考,结合专业标注团队手动调整。每个建筑实例通过多边形表示,并分配到12个细粒度屋顶类型之一。对复杂结构(例如内庭院)进行了精细标注。

  • 质量控制:标注由专业团队完成,使用严格的多轮质检流程。涉及15名标注员和2名检查员,对有争议的结果进行联合讨论以决定最终分类。

  • 屋顶分类设计:定义了12种细粒度的屋顶类型,包括平顶、双坡顶、四坡顶、拱形顶、锥形顶等。分类基于主流标准(如OSM、CityGML)并结合遥感数据特性优化。


5. 数据格式与分割
  • 格式:遵循COCO数据集格式,方便使用主流计算机视觉工具。

  • 分割策略:每个城市的影像被裁剪为2000 × 2000像素的中型块,再细分为512 × 512像素的小型块,重叠部分为200像素。

  • 数据集分为训练集、验证集和测试集,比例为6:2:2。

  • 数据规模:总计11,336块影像,其中训练集6556块,验证集2507块,测试集2273块。多模态数据包括17个城市,含350,866个建筑实例。


6. 屋顶类型与实例分布

  • 类别分布:数据集中不同屋顶类型的实例数量不均,具有长尾分布。最常见的类型为“平屋顶”,占比最高。

  • 实例尺寸:建筑实例的尺寸跨度较大,最小面积小于10像素,最大面积接近几千像素。不同类型屋顶的尺寸分布差异显著,例如行屋顶(row roofs)通常面积较大,而锥形顶(pyramid roofs)相对较小。

  • 长宽比:数据集中还统计了实例的长宽比(bounding box的长宽比),某些类型(如拱形顶)的长宽比超过100,增加了检测的难度。

方法

本文提出的CGT模块(Class-Specific Geometry Transformer) 是一个用于增强细粒度建筑分类能力的模块,尤其是在实例分割任务中。
  • 遥感影像中的建筑实例具有明显的几何特征(如边缘、形状和轮廓),这些特征对细粒度分类(如区分不同类型屋顶)至关重要。

  • 传统实例分割模型(如Mask R-CNN)在捕捉细致的几何结构上存在不足,难以准确区分建筑的细粒度类别。

  • CGT模块通过专注于几何特征的提取与类特定学习,提升模型的分割和分类性能。

模块功能

  • 几何特征提取

    • 使用Sobel算子提取建筑的水平和垂直边缘特征。

    • 水平边缘突出横向轮廓,垂直边缘突出纵向轮廓,组合后形成完整的几何信息。

    • 提取的几何特征通过卷积网络转化为高维特征,便于后续处理。
  • 类特定几何学习

    • 采用Transformer解码器对几何特征进行解码。

    • 解码器通过类特定的查询(Class-Specific Queries),学习每种建筑类别独有的几何模式。

    • 例如,不同类型屋顶(平顶、拱形顶、双坡顶等)在边缘和几何特征上表现出显著差异。
  • 细粒度分类增强

    • 提取的几何特征被集成到实例分割模型中,使模型能够更准确地分割并分类建筑实例。

    • 提高了对几何特征明显的目标(如长条形或拱形屋顶)的分类能力。

实验与分析

实验结果

可视结果

不同城市数据交叉验证

更多图表分析可见原文


因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询投稿合作加群,加群需备注姓名/昵称,单位和研究方向)。

公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!


问题及讨论可直接在文章下方留言


相关链接:

RSE | 1.85亿中国建筑轮廓数据: 首个基于深度学习生成的中国亚米级建筑footprints数据

数据整理 | 全球大规模建筑底座数据集汇总

TGRS | P2PFormer: 武大等提出遥感建筑轮廓提取新pipeline

TGRS | Easy-Net: 轻量级建筑提取网络, 基于建筑本身特征, 结合CNN和Transformer

RSE | 基于高分七号影像估计中国超过70万个建筑高度, 结合深度学习和摄影测量技术

  欢迎关注  


分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



欢迎加入遥感与深度学习交流群(点此加入)


遥感与深度学习
聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
 最新文章