RS DL
论文介绍
题目:Urban Building Classification (UBC) V2—A Benchmark for Global Building Detection and Fine-Grained Classification From Satellite Imagery
期刊:IEEE Transactions on Geoscience and Remote Sensing
论文:https://ieeexplore.ieee.org/document/10237272
创新点
全球多模态建筑检测与细粒度分类基准数据集:提供了一个包含20个城市、跨越五大洲的高分辨率遥感影像数据集(UBC V2),标注了499,339个建筑实例,包括12种细粒度屋顶类型。数据集首次融合了光学影像和SAR影像(17个城市),实现了两种模态的精确对齐。 细粒度屋顶分类:定义了12种屋顶类型,结合了几何特征和遥感数据特点,提供了更精细的建筑分类基础。 几何特征编码模块(CGT):提出了一个类特定几何transformer模块,通过捕获建筑的几何特征(如边缘、线条和形状),提升了细粒度分类的性能。
数据
Urban Building Classification (UBC) V2,覆盖 全球20个城市,分布于五大洲,代表了不同的建筑风格和空间分布类型。包含 499,339个建筑实例,每个建筑用多边形标注,分类为12种屋顶类型。提供光学影像和多模态影像(光学 + SAR)的组合。
城市包括北京、慕尼黑、巴塞罗那、东京、圣路易斯等,覆盖五大洲。
数据集确保了建筑在外观(例如材料和风格)和空间分布(例如密集程度和排列方式)上的多样性。
每个城市包含了从商业区、高密度居民区到工业区和城郊的建筑样本。
数据集中建筑的空间排列从稀疏(如别墅区)到高度密集(如巴塞罗那的城市块)。
屋顶风格的分类涵盖了典型的全球建筑特征,例如平屋顶、双坡屋顶、拱形屋顶等。
光学影像:来自中国高分二号(GaoFen-2)和SuperView-1卫星,地面分辨率为0.5米(通过全色锐化)。
SAR影像:来自中国高分三号(GaoFen-3)卫星,提供C波段单极化SAR影像。分辨率:1米(通过重采样至0.5米以与光学影像一致)。
多模态对齐:对17个城市提供了光学和SAR影像的精确几何对齐。
标注过程:使用OpenStreetMap(OSM)、Google Maps等高质量数据源为参考,结合专业标注团队手动调整。每个建筑实例通过多边形表示,并分配到12个细粒度屋顶类型之一。对复杂结构(例如内庭院)进行了精细标注。
质量控制:标注由专业团队完成,使用严格的多轮质检流程。涉及15名标注员和2名检查员,对有争议的结果进行联合讨论以决定最终分类。
屋顶分类设计:定义了12种细粒度的屋顶类型,包括平顶、双坡顶、四坡顶、拱形顶、锥形顶等。分类基于主流标准(如OSM、CityGML)并结合遥感数据特性优化。
格式:遵循COCO数据集格式,方便使用主流计算机视觉工具。
分割策略:每个城市的影像被裁剪为2000 × 2000像素的中型块,再细分为512 × 512像素的小型块,重叠部分为200像素。
数据集分为训练集、验证集和测试集,比例为6:2:2。
数据规模:总计11,336块影像,其中训练集6556块,验证集2507块,测试集2273块。多模态数据包括17个城市,含350,866个建筑实例。
6. 屋顶类型与实例分布
类别分布:数据集中不同屋顶类型的实例数量不均,具有长尾分布。最常见的类型为“平屋顶”,占比最高。
实例尺寸:建筑实例的尺寸跨度较大,最小面积小于10像素,最大面积接近几千像素。不同类型屋顶的尺寸分布差异显著,例如行屋顶(row roofs)通常面积较大,而锥形顶(pyramid roofs)相对较小。
长宽比:数据集中还统计了实例的长宽比(bounding box的长宽比),某些类型(如拱形顶)的长宽比超过100,增加了检测的难度。
方法
遥感影像中的建筑实例具有明显的几何特征(如边缘、形状和轮廓),这些特征对细粒度分类(如区分不同类型屋顶)至关重要。
传统实例分割模型(如Mask R-CNN)在捕捉细致的几何结构上存在不足,难以准确区分建筑的细粒度类别。
CGT模块通过专注于几何特征的提取与类特定学习,提升模型的分割和分类性能。
模块功能
几何特征提取
使用Sobel算子提取建筑的水平和垂直边缘特征。
水平边缘突出横向轮廓,垂直边缘突出纵向轮廓,组合后形成完整的几何信息。
提取的几何特征通过卷积网络转化为高维特征,便于后续处理。
类特定几何学习
采用Transformer解码器对几何特征进行解码。
解码器通过类特定的查询(Class-Specific Queries),学习每种建筑类别独有的几何模式。
例如,不同类型屋顶(平顶、拱形顶、双坡顶等)在边缘和几何特征上表现出显著差异。
细粒度分类增强
提取的几何特征被集成到实例分割模型中,使模型能够更准确地分割并分类建筑实例。
提高了对几何特征明显的目标(如长条形或拱形屋顶)的分类能力。
实验与分析
实验结果
可视结果
不同城市数据交叉验证
更多图表分析可见原文
公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!
问题及讨论可直接在文章下方留言
RSE | 1.85亿中国建筑轮廓数据: 首个基于深度学习生成的中国亚米级建筑footprints数据
TGRS | P2PFormer: 武大等提出遥感建筑轮廓提取新pipeline
TGRS | Easy-Net: 轻量级建筑提取网络, 基于建筑本身特征, 结合CNN和Transformer
RSE | 基于高分七号影像估计中国超过70万个建筑高度, 结合深度学习和摄影测量技术
欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。