一种机载LiDAR建筑物点云分类方法

科技   2024-11-07 09:38   北京  


摘要:针对机载LiDAR城市点云建筑物和相邻植被容易错分的问题,提出了一种基于W-OPTICS改进超体素分割的机载LiDAR建筑物点云分类方法。通过融合体素内部点云特征差异与密度特性构建自适应权值,提出W-OPTICS算法对初始种子体素进行偏移,使得优化后种子体素兼具空间局部相似性和高密度特性,解决在建筑与相邻地类邻接处种子点随机选取导致的跨边界错分问题,结合主成分分析算法聚合关键特征后,通过支持向量机实现建筑物分类。实验结果表明:针对Vaihingen数据集,本文方法的完整率、正确率、检测质量分别达到95.0%、94.0%、89.6%,相比原始超体素方法分别提高1.7%、4.2%、5.3%,建筑物与相邻地类错分和漏分情况得到明显改善;针对实测点云数据,本文方法各项精度指标优于经典超体素方法与TerraSolid自动分类结果,验证了本文算法在建筑物分类上的稳定性和鲁棒性。

引用:[1] 廉飞宇,张良,周涵宇,等. 结合超体素与种子点优化的LiDAR建筑物点云分类方法[J]. 测绘科学, 2024, 49 (07): 164-172.  DOI:10.16251/j.cnki.1009-2307.2024.07.017. 

0 引言

“智慧城市”概念的兴起,使得快速、准确地获取城市地表信息成为摄影测量与遥感和计算机视觉等领域的热门研究内容 [1] 。近年来,机载LiDAR技术发展迅速,其精度高、受天气影响小、自动化程度高等优点,使其成为获取地表信息的重要数据源 [2] ,被广泛应用于城市规划、防灾减灾、智慧城市建设等领域 [3] ,尤其在获取3D建筑物信息和城市场景重建方面展现出巨大的应用前景 [4] 。

建筑物脚点分类作为建筑物三维重建的关键步骤,长期以来一直作为摄影测量与遥感领域的重要课题,也是众多学者关注的焦点之一。机载LiDAR点云中地物间的点密度差异,极大提升了特征识别和脚点分类的难度 [5] 。传统的基于单点的建筑物脚点分类方法通过定义一个固定3D邻域来估计单点的几何信息实现分类,这忽略了不同密度下点与点之间的空间关系差异,也限制了建筑物脚点分类精度的提高 [6] 。

近年来,面向对象的方式得到迅速发展,尤其是基于体素的方法,可以在细微的尺度上进行分割,更好地捕获目标空间关系和上下文信息,在建筑物分类领域得到了广泛应用。例如,文献 [7]将超体素及其局部凸连接斑块集成到随机森林分类器中,有效提高了点云特征计算精度并降低计算成本;文献 [8]将体素作为图的节点实现聚类,结合感知分组法则实现建筑物分类,使用基于改进的视觉词袋模型将每个超体素内的局部几何和光谱信息编码为高级语义表示,将其输入到支持向量机(SVM) 分类器中区分建筑物与其他地类;文献 [9]针对超体素存在标注结果不准确的情况,构建马尔可夫随机场(MRF)优化模型进行后处理和分割结果细化;文献 [10]将点云分割成边界细化的超体素,根据所选的2D图像和3D点特征构建每个超体素的高级特征,采用潜在狄利克雷分配(latent dirichlet allocation, LDA)模型和随机森林算法识别受损建筑。

与其他基于密度的聚类算法相似,超体素种子点的选取是影响后续分割和分类精度的关键,由于机载LiDAR的扫描特性,独立地物中心点云密度明显大于邻接处,若在邻接处选取种子点,易产生特征描述不准确的跨边界聚类错误 [11] 。因此部分学者利用点云密度特征优化种子点的选取:文献 [12]在单木分割中利用mean-shift寻找水平和垂直方向上的密度最大点确定树梢;文献 [13]利用k均值算法中距离度量的比较提取小麦籽粒数据;目前利用密度特征实现种子点优化的文献较少,集中在植被分割方向;此外,大部分学者所使用的mean-shift、k均值等密度聚类算法对参数敏感 [14-15] ,若核函数或者聚类数量等设置不当,容易导致密度重心偏移不正确,无法直接反映最大密度点位置。

针对上述问题,本文提出了一种基于加权OPTICS(weighted-ordering points to identify the clustering structure, W-OPTICS)改进超体素分割的建筑物分类方法。利用OPTICS算法 [16] 不需要预先指定聚类数量或密度阈值的特点,融合体素内部点云特征差异与密度特性构建自适应权值,提出W-OPTICS算法以选择同时满足密度最大与局部特征相似的体素作为初始种子点,使得种子体素位于独立地物中心以确保超体分割得到同质性对象;在此基础上,分别提取有效区分植被与小型地类的法向量直方图与二维几何特征,通过主成分分析算法聚合关键特征后实现建筑物分类;在Vaihingen数据集与实测数据下开展实验,验证了本文方法的有效性。

1 算法描述

图1为本文方法的具体流程,包括点云滤波、结合W-OPTICS的超体素聚类、特征提取、特征聚合与分类4个部分。

1.1 机载LiDAR点云数据滤波

机载LiDAR点云数据滤波是指从机载LiDAR点云数据中分离地面点与非地面点,它是建筑物自动化提取的重要性基础工作。本文采用无参布料模拟算法 [17] ,在经典布料模拟滤波算法下,根据局部坡度及高差来自适应调整布料硬度参数,为后续建筑物分类提供准确的非地面点云数据。

1.2 结合W-OPTICS的超体素聚类

常用超体素聚类算法中 [11] ,种子点的选取是在3D空间进行网格化后,通过选择网格内最接近中心的体素作为初始化种子点。然而,在不同对象的连接处选择初始种子时,如果代表不同对象边界的体素中心点与超体素种子特征相似,则会被划入到同一个超体素(图2),导致建筑与其他地类交界处错误分割的情况发生,从而影响后续的分类结果。

考虑到独立地物中心点云密度大于交界区域,本文融合多维特征空间信息,提出基于W-OPTICS改进的超体素聚类算法,选择同时满足密度最大与局部特征一致的体素作为种子体素,削弱建筑物与相邻地类错分的问题,保证后续建筑物分类精度。

1.2.1 体素邻接图构建

在种子体素遍历前,为准确描述点云空间拓扑关系,利用八叉树结构对非地面点云进行均匀分割,形成体素并获取体素质心,采用快速点特征直方图(fast point feature histograms, FPFH) [18] 描述该质心的局部特征属性用以表征该体素内的所有点,并根据八叉树的邻域关系,构造体素邻接图。

1.2.2 基于W-OPTICS 密度自适应的超体素种子体素优化
1)OPTICS算法

20世纪90年代,Ankerst M提出OPTICS算法用以解决基于密度的聚类问题,对于每个数据点,计算其核心距离和可达距离,依据距离内邻域数据点信息,获取核心对象,基于密度分布实现不同分组。

假设点数据集合为X={x 1,x 2,…,x n },邻域半径为r,邻域最少点数为MinPts,若对象p的邻域r至少包含MinPts个对象,则该对象是核心对象,将核心对象根据密度可达关系进行排序,以获取各点密度分布情况。相比其他算法,OPTICS算法通过生成一个有序的簇结构图对聚类结果进行描述,且不需要预先指定聚类的数量或密度阈值,自适应地处理不同密度的簇,更加高效准确地寻找局部密度最大值。

2)基于W-OPTICS的种子体素自适应偏移

传统的OPTICS算法通常将单点作为处理对象,基于空间位置进行密度最大值的遍历。本文通过计算快速点特征直方图,结合体素内点云数量作为该体素的权重,构成W-OPTICS算法,选取不同地类中心处体素作为种子点。

本文利用多维特征差异与空间位置量化距离信息,通过体素间点云密度差异来计算权重,同时综合考虑特征相似性和空间位置信息,由此得到的最终种子体素不仅具备空间局部相似性,还具有更高密度特点,通常位于独立地物中心,有效避免同一超体素包含两个不同物体的情况;相较于传统的OPTICS算法对范围内所有点进行遍历,本文基于体素进行局部最大密度值的遍历,计算量小,效率更高。

1.2.3 流约束超体聚类

获取种子体素后,结合体素邻接图的边矩阵,利用最小归一化FPFH距离进行聚类 [19] 。当体素与种子体素之间的归一化距离是该体素边矩阵中的最小值时,则将该体素的标签修改成与种子体素一样,同时将该体素邻接图中的相邻节点加入聚类的搜索队列中。迭代该聚类过程,直至到达每个超体素搜索域的边界或没有更多的邻接节点需要聚类时,该增长聚类过程终止。

1.3 基于超体素的建筑物分类

为充分发挥超体聚类分割后的点簇在城市三维点云分类中的作用,本文从地类形态体积差异出发,构建表现不同地类与建筑物的差异特征,并通过主成分分析法筛选有效信息后利用支持向量机(support vector machine,SVM)完成建筑物分类。

1.3.1 特征提取
1)基本特征

基于原始数据中的高程信息、平面坐标、回波信息,利用圆柱体邻域分别提取了与强度、高程相关的特征 [20] ,总共6个。

2)相似地类特征

城区场景中对于体积与建筑物相似的地类(如植被),利用两者表面形态差异大的特点,提取法向量直方图进行区分 [21] 。步骤:分析簇内近邻点协方差矩阵,计算簇内各点局部曲面法线;统计各簇内的法向量信息,生成法向量直方图;基于法向量直方图,统计各簇内的平均值、标准差。

3)差异地类特征

为对三维城区场景中体积较小与低矮地物有效剔除,本文提取二维几何特征对其进行识别,提取流程:将点云对象从三维空间转换为二维空间,使用alpha shapes算法确定紧密围绕点簇的边界,并计算其最小外包矩形(minimum oriented bounding box, MOBB) [22] ;结合Alpha形状和最小外包矩形,进行矩形度(R)、伸长度(L)、压实度(C)等二维几何特性的提取。

1.3.2 SVM分类

由于各地物之间的相关性,上述特征所表征信息存在一定程度的重叠。为保留关键信息的同时降低维度,提高模型泛化能力,本文采用主成分分析算法对上述特征进行聚合,选取前6维特征向量输入到SVM分类网络,实现建筑物提取。

2 实验结果与分析

2.1 实验数据与过程

本次实验的标准建筑物分类数据集由国际摄影测量与遥感协会(International Society for Photogrammetry and Remote Sensing, ISPRS)第三工作组提供 [23] 。数据采集地位于德国南部的Vaihingen地区,通过Leica ALS50激光扫描仪获取,数据集包含多种地物,如植被、建筑物等,每平方米约7个点,分别包括37、14、56栋建筑物,周边植被树木较多,点云数量分别为188 997、314 590、266 211。为了测试本文方法针对建筑物和植被密布区域的效果,选取江苏张家港地区实测数据开展试验,数据由leica ALS70获取,每平方米约20个点,分别包含32、40栋建筑,点云数量分别为911 780、746 945,如图4所示,测试区内植被茂密,和建筑物毗邻,分类难度大。

实验环境在win10系统上搭建,显卡为RTX 1080Ti GPU,CPU为IntelCore-i5 10400F,编程语言采用C++。采用高斯径向基函数(Radial basis function kernel, RBF)作为核函数,进行模型训练和验证。

2.2 精度评价与分析
2.2.1 聚类效果对比

在建筑与植被密布场景中,超体素种子点的随机选取会导致跨边界问题,如图5中框选区域所示。Vaihingen数据Area3中,在建筑植被分布密集的区域原始方法 [11] 存在大量建筑与植被、噪声划分到同一对象的情况,通过W-OPTICS算法优化种子点选取过程,有效纠正了原始方法中建筑、植被、其他地类划分到同一对象的情况,建筑与相邻地物处于同一对象的情况明显减少,如图5中②和③所示。

经上述对比可知,本文方法通过种子点优化,保证了聚类结果的同质性,能够更加有效的表达不同地类之间的差异,保证后续分类精度。

2.2.2 建筑物分类与分析
1) ISPRS标准数据实验结果

为了定量分析建筑物分类结果,本节通过完整率(completeness, Comp)、正确率(correctness, Corr)、检测质量(quality, Q)3个指标对比两种方法的建筑物分类精度 [24] 。

为了比较不同方法在Vaihingen数据集下建筑物提取的效果,选择了ISPRS官方网站具有代表性的10种使用LiDAR点云数据建筑分类方法。并结合近年来建筑物分类研究的相关文献 [25-26] 的精度结果进行对比。其对比结果如表3所示。

由表3可知,针对Vaihingen实验数据集,本文算法完整率为95.0%,优于表中其他对比方法,表明本文方法确保超体分割得到同质性对象,使得后续建筑物的分类更完整;质量系数达到89.6%,反映了本文算法在确保建筑物分类质量方面的高效能,具有不错的稳定性和鲁棒性;正确率为94%,略低于最优算法,可能原因在于本文聚焦超体分割算法的优化,分割后的特征选取和表达方法略简单,因此出现了少量的错分和漏分,这也是后续重要的优化方向。

2) 实测数据实验结果

对张家港地区的点云数据使用TerraSolid软件以及人工后处理进行分类,得到4类地物:地面、植被、建筑物与其他地类。将人工提取的建筑物点作为真值,分别对比TerraSolid、经典超体素方法 [11] 与本文方法的分类结果,精度评估结果如表4所示,对比完整率、正确率、检测质量,本文方法比经典体素分割法高1.2%、2.9%、3.4%;比TerraSolid高3.4%、7.4%、8.7%。

本文方法在不同区域对各种尺寸和形状的建筑物进行了有效提取。在区域1中,本文方法完整率提高3%,有效减少了建筑物的漏分现象,如图8(a)中的1、2所示;正确率指标提升不明显,主要由于区域中植被与建筑物相对分离,建筑与植被之间的错分情况较少。在区域2中,本文方法的正确率提高4.3%,数据中建筑与植被交错分布,通过将种子体素移动至不同地类中心,减少了植被误分为建筑的情况,如图8(b)中的3、4所示。结果证明,本文算法能够精准提取实测数据中的绝大多数建筑轮廓,减少后处理工作量,极大地促进后续建模等工作的开展,具有较高的应用价值。

3)时间性能分析

本文算法与经典体素分割算法 [11] 耗时环节均包括:点云滤波、种子点选取、超体聚类、超体素特征提取、标签映射5个部分。

针对Vaihingen数据,经典体素分割算法耗时约77 s, 本文方法耗时约83 s; 针对张家港数据,经典体素分割算法耗时约128 s, 本文方法耗时约137 s, 可见本文方法在时间性能方面,与经典体素分割算法 [11] 相差不大,时间复杂度增加控制在10%以内。主要原因在于本文方法基于体素进行局部最大密度值的遍历,计算量小,相比原始方法时间复杂度增加不大。考虑到本文方法对分割完整度有着较大的提升,可认为获得的收益明显大于时间成本的微量递增。

3 结束语

为解决城区中建筑物和植被密集区域分类难的问题,本文提出了一种基于W-OPTICS改进超体素分割的建筑物点云分类方法。通过W-OPTICS改进超体素种子点选取问题,选取满足密度最大值与局部相似性强的体素作为种子体素,减少建筑物相邻地类对分割的影响;聚合法向量直方图与二维几何形状等特征后,采用SVM实现建筑物的准确分类。实验结果表明,本文方法在标准实验数据与实测数据下均有不错的分类结果,有效减少了建筑物与相邻地类的错分情况,具有不错的稳定性和鲁棒性。然而,如何加强超体素分割中的特征表达以及精细化后处理流程,将作为下一步工作的重点。

(原文有删减)

机载LiDAR点云分类研究进展与趋势


LiDAR都能干什么?看2020-2024技术进展


⬆️联系我们⬆️

测绘学术资讯
导航、遥感、GIS、地图、地理、大地测量、无人机、智慧城市、自然资源监测、等等学术、技术和资讯。
 最新文章