TPAMI | 大型城市场景的建筑实例分割和3D重建, 基于航拍图像

文摘   2024-11-01 11:52   荷兰  

 RS   DL 

论文介绍

题目:Fast Building Instance Proxy Reconstruction for Large Urban Scenes

期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence

论文:https://ieeexplore.ieee.org/document/10499907

年份:2024
单位:中科院自动化所等

创新点

  • 高效的3D建筑代理重建工作流程:提出了一种创新的工作流程,从航空影像中高效地进行大规模城市场景的实例级3D建筑代理重建。
  • InstFormer网络和多视角融合算法:设计了一种新的神经网络InstFormer,用于从航空影像中提取建筑实例掩码,并通过基于投票的多视角实例融合算法来整合不同模态的信息。这一方法有效地实现了稀疏且带噪点的点云中的建筑实例分割。
  • 基于层的轻量化建筑代理重建算法:提出了一种基于层的建筑代理重建算法,能够在极其稀疏的点云中生成轻量级的城市建筑表面模型,有助于在保持效率的同时生成精确的建筑表面表示。
  • 城市场景分割和重建的基准数据集:构建了两个基准数据集,用于评估城市场景分割和重建性能。
    在本文中,“代理”指的是简化的3D建筑模型,代表真实建筑的形状和结构

数据

1. 实例分割数据集

  • 组成:该数据集包含720张航空影像,覆盖了四个不同的城市,拍摄高度不同。

  • 标注:这些影像中的建筑实例都由八位计算机科学专业的学生手动标注,使用了LabelMe工具。

  • 特点:与其他数据集(如COCO、PASCAL VOC)不同,该数据集专注于多视图航拍图像的建筑实例分割,提供了高分辨率的建筑屋顶和立面图像,适合大规模城市场景的实例分割和3D重建。

2. 代理和场景重建数据集

  • 组成:该数据集分为虚拟和真实场景,包含了多个虚拟场景用于实验室控制下的评估,同时包含六个真实城市场景。

  • 虚拟场景:作者使用虚幻引擎和物理引擎Airsim模拟无人机拍摄,生成了高仿真度的城市建筑图像。这些虚拟场景包含几十个建筑,并配有丰富的几何细节,用于综合评估路径规划和3D重建效果。

  • 真实场景:使用DJI Phantom 4 RTK无人机拍摄,图像用于代理重建,初步路径规划后进行优化,以确保覆盖建筑细节。

方法

总体结构

三个核心模块:建筑实例分割、投票式多视图实例融合和基于层的代理重建

1. 建筑实例分割

本文提出了InstFormer神经网络,用于航空影像中的建筑实例分割。
  • 分割使用垂直拍摄的影像:由于建筑屋顶在垂直影像中无遮挡,便于准确分割,因此网络专注于处理这些影像。
  • 多阶段级联结构:InstFormer采用多级的级联架构,每一阶段生成更精细的建筑边界和实例掩码。网络首先通过粗略的边界定位建筑,然后通过细化逐步提升分割的精确度。
  • 特征金字塔和上下采样模块:为提升分割精度,InstFormer通过特征金字塔提取不同尺度的建筑特征,结合上下采样模块来融合全局和局部特征信息,使分割更具鲁棒性。


2. 投票式多视图实例融合

InstFormer分割出多视图影像中的建筑实例掩码后,通过一个基于投票的多视图融合算法将这些掩码整合为一致的3D实例表示。具体步骤如下:
  • 掩码与点云的匹配:利用结构运动(SfM)生成的稀疏点云,将2D实例掩码与点云特征点相对应。

  • 投票机制筛选掩码:在不同视角的影像中,多个掩码可能对应同一建筑实例,通过投票的方式确认有效掩码。此机制将过滤掉过度分割或无效的掩码,提高分割精度。

  • 构建3D建筑实例:根据筛选出的有效掩码,将掩码信息投影到3D空间,从而实现对完整建筑实例的3D分割。


3. 基于层的代理重建LWPxy

在完成建筑实例的3D分割后,本文提出了一种基于层的代理重建方法,将稀疏点云重建为轻量化的3D建筑模型。
  • 垂直层切分:将建筑点云沿垂直方向切分为多个层,每层代表建筑的水平切面,通过切面上的点云信息提取建筑轮廓。

  • 结构特征提取:对于每一层,提取建筑的结构轮廓,并生成2D凸包,确保每层的轮廓完整且满足代理模型的简化要求。

  • 多层轮廓叠加:将所有层的轮廓沿垂直方向叠加生成3D体积网格,以逼近建筑的真实几何形状。

  • 表面提取:采用逐层表面提取的方法,仅保留外表面,去除内部冗余面,从而生成一个闭合的、轻量级的建筑代理模型。

实验和结果

结果表明,LWPxy方法生成的代理模型相比其他方法在误差和完整性上更具优势,能有效提升最终重建的细节和精确度。同时,相比于基于密集点云的代理模型,LWPxy以更低的计算成本实现了相近甚至更优的重建质量。

精度对比

可视结果

更多图表分析可见原文



欢迎关注会议论文赏读系列

因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询投稿合作加群,加群需备注姓名/昵称,单位和研究方向)。


公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!




问题及讨论可直接在文章下方留言


相关链接:


论文赏读 | NeurIPS24 | SynRS3D: 合成遥感数据集, 可用于单目语义分割和高度估计等任务
论文赏读 | CVPR24 |单目遥感图像3D建筑重建,多级监督框架MLS-BRN
论文赏读 | CVPR24 | 从2D到3D,基于航拍影像的城市语义分割及建筑实例分割
论文赏读 | RSE | 全国尺度的建筑精细提取和3D重建,覆盖300余个城市,基于高分辨率卫星图像
论文赏读 | CVPR24 | 由卫星影像生成3D城市场景,基于扩散模型

  欢迎关注  


分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



欢迎加入遥感与深度学习交流群(点此加入)


遥感与深度学习
聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
 最新文章