研究 | 基于实景捕获的既有建筑结构化建模:建筑师视角的概述

文摘   2025-01-03 11:29   上海  



引言


输入实景图像,得到三维模型——处于持续探索中的“三维重建”技术,是计算机图形学和计算机视觉领域的关键研究方向之一,主要专注于从二维图像中提取并重建物体的三维形态。这项技术已被广泛应用于数字孪生、增强现实、电影制作、游戏开发、地图绘制、医疗建模等多个领域;其中也包括与建筑行业相关的城市更新、遗产保护、人流感知、空间运维等应用场景。

三维重建技术起源于20世纪70年代,彼时主要依赖于手工测量和计算来创建三维模型。随着技术和设备的不断进步,到了20世纪90年代,该技术实现了三维数据的自动化采集和处理。进入21世纪后,深度学习技术的突破为三维重建技术带来了革命性的发展,特别是在处理复杂场景和实现实时三维重建方面取得了显著的进展。

三维重建技术在建筑行业内具有广阔的应用前景,但建筑物的建模并不等同于一般三维重建任务。作为典型的人造物,建筑物具有显著的内在结构逻辑——不限于人们认知建筑的需要,也关乎它被设计和再设计的规则。因此,既有建筑的三维重建不能停留在外观信息的简单复刻,而是要提取出内在的复杂逻辑信息。获取具有内在逻辑关联的三维模型,这一过程可以称作“结构化建模”。本文将从建筑师的视角,概述相关技术环节。

/ 体育建筑看台的三维重建(来源:自绘)/



内涵


三维重建是一个将二维图像转化为三维信息的复杂过程。实现三维重建,首先要做的就是获取二维图像作为信息输入。二维图像通常是由RGB像素数据组成的有序排列,可以通过相机等设备捕获。随着技术的演进,市场上出现了更先进的扫描设备和相应的数据格式。一些相机设备甚至能够提供深度信息,生成RGB-D图像。尽管深度信息使得原始数据超越了纯粹的“二维”范畴,但这些额外信息的运用有时也被视作三维重建的一部分。我们可以将这些技术和方法统称为“实景捕获”,它们共同推动了三维重建技术的发展和应用。

作为输出的三维信息同样具有涵义上的复杂性。三维信息通常指的是能够代表三维空间的模型,其中最典型的是非结构化的三维模型。这些模型包括点云模型、网格面模型、体素模型以及其他附着在空间中的向量信息。体素与像素可以类比理解,点云和网格分别通过非均匀分布的点或三角面数据来表示物体。在这里,“非结构化”一词具有双重含义:首先,它指的是这些模型不包含语义信息,即它们不直接提供关于物体性质或功能的描述;其次,它还意味着这些模型不包含拓扑关系,即它们不描述物体各部分之间的连接方式或空间关系。

相比之下,建筑行业内使用的模型往往包含丰富的内在“结构”。这些结构从点线面体的逻辑到构件信息的附着,都与点云数据有显著的差异。建筑模型中的结构信息不仅包括几何形状,还包括材料属性、构件之间的关系、建筑功能等,这些信息对于建筑设计、施工和管理至关重要。因此,虽然点云和建筑模型都是三维信息的表现形式,但它们在应用场景和所需信息的深度上有着本质的不同。

本文立足建筑行业,从建筑师的实际业务需求出发探讨三维重建技术,因此更关注具有一定结构,乃至高度参数化的建筑三维模型;而实景捕获部分,不论是不是纯粹的二维数据,只要具有取得的潜在可能,都值得探讨。基于这样的视角假定,技术环节的叙述可以依托于特定(但不必然)的流程,即被串联的一系列环节:实景捕获、点云生成、语义分割、几何提取和拓扑推理。其中,实景捕获是获取原始数据的步骤,严格来说不是三维重建过程的内部组成;点云生成是狭义的三维重建,且具有转换为体素模型和mesh面模型的潜力;语义分割、几何提取和拓扑推理则是扁平三维信息获得“结构”的过程。后续介绍将以上述环节串联作为叙述线索。

(a)点云模型(b)点云模型内的空间(c)结构化模型(d)结构化模型的外框线

/ 建筑的点云模型与结构化模型示例(来源:文献1)/



点云生成


在计算机视觉领域,将二维图像转换为点云是一个经典而复杂的挑战。最直接的方法是使用能够捕捉深度信息的设备,如RGB-D相机,这种转换实际上是一个三维到三维的过程。在深度信息的提取上,结构光法和飞行时间法是两种主要技术,前者以其高精度著称,而后者则因其广泛的测量范围而受到青睐。

然而,如果在现场捕获阶段无法获得深度信息,就必须依赖于二维图像本身来推断三维信息。这一过程并不固定,可能涉及多个子问题,包括相机姿态估计、多图像间的特征点匹配、像素深度估计等。在这种被动式的点云生成方法中,有两个经常被讨论的概念:运动结构恢复(Structure from Motion, SfM)和多视角立体视觉(Multi-View Stereo, MVS)。SfM通过相机姿态估计和图像特征匹配来重建稀疏点云,而MVS则利用光度一致性进行立体匹配,从而获得稠密点云。

这些基于透视几何原理的方法可以被归类为传统几何方法。深度学习方法能够在这些传统方法的基础上进行优化,无论是对整个流程的微调还是解决特定的问题。深度学习在优化过程中的优势体现在提高运算速度、增强纯度和提升准确度等方面,同时它还能解决一些特殊问题,如基于单张图像的三维重建和光场重建等。

总体来看,点云生成是一个相对客观的任务,当前的研究和探索已经取得了相当程度的进展。



语义分割


为像素、体素、点云等数据赋予语义标签是语义分割的核心任务。以一组描绘室内空间场景的点云数据为例,通过添加标签,我们可以明确哪些点代表墙面、地面、桌子或椅子等。由于同属一个物体的点在三维空间中往往聚集在一起(例如,室内的墙面不太可能包含地面上的细尘),因此这种标签的添加不仅仅是特征提取或分类,而是一种与空间相关联的“分割”过程。

在建筑物的结构化建模中,最关键的“分割”任务是识别墙体、楼板、梁、柱等结构,并据此划分出各个房间。这一任务具有特殊性,不同于一般性的分割问题。常用的策略是先提取墙线,然后结合墙线和专业知识进行进一步的匹配和识别。这种方法与后续的“几何提取”步骤紧密相连,通过提取几何要素来完成点云的分割。此外,也有研究采用贝叶斯理论、Voronoi图、侵蚀函数等方法,但总体而言,墙线提取是一种更简单直接、适合实际应用的方法。

/ 通过语义分割得到房间划分(来源:文献2)/


对于形状各异的独立物体,如房间内的家具,点云分割问题更具典型性,且与其他行业的业务场景具有通用性。即便如此,在建筑相关的三维重建中,独立物体的分割也具有应用价值,因为实际捕获的场景数据中常常包含这类物体。相应的处理方法也较为多样,除了传统的边缘检测、模板拟合外,还包括区域增长、多视图分析、图卷积神经网络等技术。

由于建筑物内部的大部分空间是未被实体占据的,整体的语义识别任务相对容易。然而,对于更精细的构件和物体的识别,则在难度上更高,需要更复杂的技术和算法来实现精确的分割和识别。



几何提取


语义分割技术将扁平的数据信息进行分类整理,但它并没有从根本上改变数据的非结构化特性。例如,通过点云分割,我们可以识别出一系列具有相同属性的点代表一扇门,但这并不包括门的具体尺寸、位置等详细信息。几何推理的目标是基于几何要素来识别实体的存在,并将其从离散的点构成的空间占据转换为清晰、简洁的概念构件。在几何概念层面,建筑物建模常用的几何对象包括点、线、面、体等。因此从离散点信息中提取几何概念也就意味着提取线、面、体。

提取线的方法可以理解为预定义方程的拟合过程。这可能涉及在人工标注辅助下提取关键线,或者直接从一组点中提取中心线、两组点的边界线,以及两面的交线等。对于建筑物而言,提取到的线往往是面和体的特征描述,起到辅助识别的作用。

提取面的方法尤为常见,因为扫描得到的点云数据本质上是在描述一些不规则的表面。面提取的工作是从这些数据中还原出更规则、更简洁的表面描述。对于建筑物而言,面提取的方法与墙体、地面等概念相吻合,但对于梁、柱以及更复杂的语义信息的作用有限。

提取体的方法与建筑师的建模工作直接相关,也最有利于后续拓扑关系的推理。与面提取方法相比,体提取方法的“多解性”更为明显,因此对知识经验的利用要求更高;相应地,所建立的模型也更容易体现出专业性,满足建筑师的需求。

从方法层面来看,几何对象的提取包括传统几何方法和深度学习方法。传统几何方法显式体现了对建筑构件的知识经验,总体上是通过既有知识描述试图提取的对象,并通过优化方法最小化损失函数;具体操作在这两方面因研究而异,解决的问题定义范围也不尽相同。基于深度学习的方法也呈现出较大的差异性,一些研究超越了本文所采用的叙述线索,例如在语义分割环节利用深度学习方法将分类完成得足够细致,相当于将几何推理的部分任务提前完成;具体的方法也各不相同,包括深度神经网络(DNN)、图卷积神经网络(GCN)、条件对抗生成网络(cGAN)等。

几何提取的结果实际上是对建筑构件的一种认知。语义分割和mesh面生成能够得到几何对象,但不能被视为几何提取结果的原因在于认知的简洁性问题。在这个意义上,几何提取带有“主观”的特征,因为它涉及对数据的解释和概念化,而不仅仅是数据的分类和识别。

/ 建筑几何要素的提取方法(来源:文献1、3)/

/ 墙地面几何要素的提取(来源:文献4)/



拓扑推理


在建筑物建模中,几何对象不仅具有位置和形状等属性,还包含重要的拓扑关联。这些拓扑关系包括门附着于墙、房间之间的连通性,以及空间的层级嵌套逻辑等。虽然在建筑师的实际工作中,并非所有模型都能完美地表示这些内在的拓扑关系,但包含这些信息的模型无疑具有更强的可编辑性,并能提供更多设计、管理和运维所需的信息。

房间拓扑关系的推断是一个典型的例子。通过建立房间之间的连接关系,设计师可以分析现有建筑的交通流线,并为使用者提供室内导航服务。房间之间的邻接关系可以通过位置信息来判断,而连通关系则需要通过识别门等构件来辅助建立。房间的拓扑关系构成了一个相对独立的系统,其中建筑中的不同空间被表示为图中的顶点,而它们之间的关系则通过边来表示。在这种独立的基础上,图结构中的顶点需要通过坐标值的赋予来对应到实际空间,或者通过子空间的划分来实现有效匹配。

/ 建筑物建模中的几何要素和拓扑关系(来源:indoorgml.net)/

/ 包含拓扑推理的三维重建流程(来源:文献5)/


面向建筑设计的拓扑关系具有二重性,即实体要素与空间要素之间的对立关系。这两套逻辑都存在一定程度的模糊性,并且它们之间并不直接对应。在描述拓扑关系的图结构中,顶点通常与现实中的一个点坐标相对应,从而将二重关系连接起来。无论是采用人为编写的规则,还是基于先例的机器学习方法,都可能面临由于二重关系带来的不完备性问题,只能在特定范围内适用。

为了提高模型的准确性和实用性,建筑师和研究人员需要开发更精细的方法来推理和描述这些拓扑关系,进而提供更加强大和灵活的工具。



总结展望


当前与三维重建相关的智能技术已经取得了长足的发展,留予我们的问题是,如何在实际建筑设计业务中充分利用这些技术。前述四个方面的概述中,点云生成面向相对客观的输出要求展开,因而已经发展得较为全面;语义分割、几何提取、拓扑推理与人的观念相关,因而还原效果与对应观念的明晰程度相关,可以被简洁定义的观念,在还原上也就更为容易。对建筑师而言,值得思考的问题是主观而理性的:当我们阅读或操作建筑设计时,我们心中的观念是什么呢?

华建科技建筑数字化技术研究所在三维重建相关方向做了广泛探索,内容包括基于非结构化建筑工程图纸的BIM建模,基于实景图片的对象还原,基于业务专项的图片数据库等。研究所近期完成了由体育场馆内场照片推测看台碗模型的实验。该实验的创新之处在于,对原始数据的要求大大降低,可从互联网数据筛选得到,不需要携带扫描仪进入建筑现场;将领域知识充分嵌入到建模过程中,以智能优化方法推测建成案例实况;另外,相较于正交的规则构件建模,该实验尝试了多弧线对象的拟合,具有更高复杂度。

面向数字赋能的设计未来,高度拟真的三维场景、实时更新的孪生模型、灵活可变的交互接口将成为无处不在的现实。在三维重建相关的未来场景中,仍有一片寓于建筑师观念中的图景,有待我们用知识和经验还原。

/ 体育场看台碗的三维重建(来源:自绘)/



图片来源文献

1.Previtali M, Díaz-Vilariño L, Scaioni M. Indoor Building Reconstruction from Occluded Point Clouds Using Graph-Cut and Ray-Tracing. Applied Sciences. 2018; 8(9):1529. https://doi.org/10.3390/app8091529

2.Biao Xiong, Yusheng Jin, Fashuai Li, Yuwei Chen, Yiquan Zou, Zhize Zhou,Knowledge-driven inference for automatic reconstruction of indoor detailed as-built BIMs from laser scanning data,Automation in Construction,Volume 156,2023,105097,ISSN 0926-5805,https://doi.org/10.1016/j.autcon.2023.105097.

3.Previtali, M., Scaioni, M., Barazzetti, L., Brumana, R., and Roncoroni, F.: Automated detection of repeated structures in building facades, ISPRS Ann. Photogramm. Remote Sens. Spatial Inf. Sci., II-5/W2, 241–246, https://doi.org/10.5194/isprsannals-II-5-W2-241-2013, 2013.

4.Xiang Gao, Ronghao Yang, Xuewen Chen, Junxiang Tan, Yan Liu, Shaojun Liu,Indoor scene reconstruction from LiDAR point cloud based on roof extraction,Journal of Building Engineering,Volume97,2024,110874,ISSN2352-7102,https://doi.org/10.1016/j.jobe.2024.110874.

5.Juntao Yang, Zhizhong Kang, Liping Zeng, Perpetual Hope Akwensi, Monika Sester,Semantics-guided reconstruction of indoor navigation elements from 3D colorized points,ISPRS Journal of Photogrammetry and Remote Sensing,Volume 173,2021,Pages 238-261,ISSN 0924-2716,https://doi.org/10.1016/j.isprsjprs.2021.01.013.



作者简介



相关推荐


研究 | 数字技术在设计业务场景中的创新赋能与战略思考

研究 | 建筑结构振动问题及控制策略

研究 | 强潮河口的生态危机与修复之路

研究 | 城市复杂建设环境下的免共振微扰动高频振沉式钢桩技术应用研究

研究 | 撷秀成园,海派风韵——园林博览会中的上海展园设计回顾

研究 | 航站楼建筑多尺度的结构表达

研究 | 探索可持续的城市更新资金模式:REITs如何赋能六大行动

研究 | 基于机器学习的体育建筑看台数字化设计——以综合田径场、专业足球场为例

研究 | 生活中无处不在的“风”

研究 | 研究型医院设计前沿探索

研究 | 模块化建筑数字设计

研究 | 光伏一体化BIPV幕墙适应性设计

研究 | 创造美丽家园——以居民满意度为导向的陪伴式循证设计方法

研究 | 从园艺景观走向博览人文——漫谈展览温室发展史


华建技术A-TECH
隶属于华东建筑集团股份有限公司,旨在搭建汇聚行业智慧、促进技术创新的交流平台。我们传承内刊多年历史积淀,坚守技术初心,关注工程设计咨询全行业的技术发展,聚焦技术的新和质,致力于传播创新文化,分享高质技术,打造行业科技创新与技术交流的新平台。
 最新文章