推荐语:今天给大家分享一篇最近出版在Transactions in GIS的一篇文章。Transactions in GIS是一本国际性和跨学科的期刊,致力于发表空间科学和地理信息系统领域的最新进展与最佳实践。空间科学涵盖地理学在组织、表示、存储、分析、建模和可视化信息方面的各种应用方式。主要议题包括地理信息系统(GIS)、全球定位系统(GPS)、遥感、地理空间数据获取、空间数据基础设施、结构与数据库等。
摘要
本文提出了一种基于信息融合的城市混合功能识别方法,用于定量识别混合状态下的城市功能区(UFZ),以满足城市规划和管理的迫切需求。该方法融合了社会感知数据和物理感知数据,综合考虑了城市功能出现的频率和人类活动的强度。具体而言,本文从众包智能设备数据中提取“动态”人类活动特征,从街景图像中提取“静态”视觉特征。基于融合的多模态数据,该方法能够更准确地推断城市功能区(UFZ)的混合分布分布状态。此外,本文构建了一个标准化的混合城市功能区(UFZ)数据集,用于模型训练和测试,数据集包括住宅、商业、公共服务、工业和生态五大类别。总体而言,该方法将功能标签识别任务转化为概率分布识别任务,旨在解决复杂的土地利用分布问题,而不是简单地为每个区域分配单一标签。结果表明,该方法的预测能够达到0.542±0.143的余弦相似度、0.785±0.043的最低切比雪夫距离、0.264±0.080的L1距离。这表明预测结果较为准确和一致,更接近真实分布。
重点
· 提出了一种基于物理和社会感知数据融合的新的方法,用于定量识别城市功能区的混合使用情况;
· 通过结合功能稀缺性(TF-IDF权重)和人类活动强度(人口权重),更准确地反映了各功能区内不同功能的相对重要性;
· 创建了一个标准化的混合城市功能区数据集,涵盖了居住、商业、公共服务、工业和生态等类别,用于模型训练和测试。
1
引言
伴随着城市扩张的是城市功能区(UFZs)的持续变化,同时,实际的城市发展往往偏离早期的城市规划,而规划难以频繁更新(城市规划通常每5年或10年重绘一次)。规划中规定的土地用途与当前功能之间的不一致性也导致了对城市功能区的监测产生了需求。
城市中相同类型社会经济活动的空间聚集形成了城市功能区,它们指的是为特定经济、社会和环境功能分配和使用土地资源。每个功能区都由一个或多个功能(如居住、教育或商业)主导。例如,一个主要用于工业用途的区域具有强烈的工业功能属性;如果土地资源主要用于居住建筑,那么该区域就具有强烈的居住功能。城市功能区是城市的重要组成部分。与强调地表物理特征的典型土地利用和土地覆盖(LULC)分类任务不同,城市功能区的识别更注重社会经济功能属性。
现有的城市功能研究大多是为每个区域分配一个详细的标签。然而,功能区很少被单一功能占据,存在许多"混合用途街区"。定量描述城市区域中各种功能的权重(主导功能)仍然是一项具有挑战性的任务。此外,一个街区通常由不同高度的建筑(意味着不同的人类活动密度)和不同功能类型的建筑组成。换句话说,由于人口和出现频率的不同,不同建筑可能具有不同的重要性。例如,火车站可能在一个区域内占据相对较小的面积,但由于其较高的人类活动强度和较为稀缺的出现次数,仍可能被视为该区域的"主导功能"。这是因为火车站通常作为连接城市不同地区人群的交通枢纽,是城市基础设施的重要组成部分。
因此,研究空白在于如何将人类活动强度和功能频率纳入混合用地考虑的范畴中,特别是要重点关注主要功能所起的作用。换句话说,目前仍没有统一的方法来量化和识别这种混合用途状态。为了有效应对混合用途多样性和人类活动强度所带来的挑战,必须全面且深入地了解城市环境。现有的城市环境感知方法大致可分为两类:社会感知和物理感知,它们在感知精度、感知范围和感知动态方面存在显著差异。社会感知方法覆盖范围广,能提供及时反馈。相比之下,物理感知方法具有格式统一和感知质量更高的优势。近年来,基于传感器网络的物理感知和社会感知技术取得了巨大进步。地理标记大数据在城市空间中实现了广泛覆盖。智能手机、可穿戴设备、监控摄像头和车辆等无处不在的感知设备极大地推动了感知能力的发展。每个人都可以被视为一个“传感器”,对真实空间中的事件和实体提供反馈,不断产生大量多模态感知数据。这些数据不仅包括定量数据,还包括自然语言文本、图像和视频。这些数据极大地加深了对城市的了解,并为城市功能区的研究带来了显著变化。本文讨论了如何结合这些数据,以更好地解决识别城市功能区(UFZs)中存在的研究问题(表1)。
在本研究中,首先构建了一个城市功能的定量数据集,考虑了功能出现的频率和人类活动的强度。随后,使用了一种基于信息融合的城市功能区多样性识别方法。本研究考虑五种主要城市功能(住宅、商业、公共服务、工业和生态)的概率,并探讨了城市功能的混合状态。
2
文献综述
关于城市功能区(UFZs)的现有研究大致可分为三类。第一类是基于遥感影像数据,利用卷积神经网络(CNNs)及其变体进行识别。第二类主要依靠GPS轨迹数据和手机信令数据。这些研究主要使用轨迹相似性匹配或起讫点(OD)复杂网络分析方法来识别城市功能区。第三类利用自然语言处理(NLP)算法提取潜在的地理特征。最常用的挖掘算法包括词频-逆文档频率(TF-IDF)、潜在狄利克雷分配(LDA)主题模型和概率潜在语义分析(pLSA)。这些无监督聚类方法能够自动确定城市功能区(主题)的数量。此外还包括Word2vec等词嵌入模型以及Place2vec等改进算法。另一种标准的处理方法是将兴趣点(POI)类别(如商业类别)类比为“词”,将区域类比为“文档”,以获得更密集的嵌入表示。
表格 2 关于城市功能区域近期研究的数据和方法。
如表2所示,一些近期的城市功能区相关研究根据其主要数据源、分析尺度层次、关键分类数量和主要研究方法进行了描述。基于数据源,这些方法大致可分为基于高分辨率遥感影像的方法和基于城市时空大数据(社会感知)的方法。据统计,50.98%的城市功能或土地利用识别研究仅使用了单一数据源,而49.02%的研究使用了两个或更多数据集。由于POI易于获取且地理含义丰富,它们是使用最广泛的数据,被74.51%的研究采用。
3
城市功能区分布识别方法
如图1所示,本文进行了一项旨在检测城市功能分区(Urban Functional Zones,UFZs)的实验。该实验的目的是将城市活力与功能稀缺程度提炼为可量化的指标,并构建一个混合分布数据集以供模型学习。此外,本文还构建了一个信息融合网络,用于识别土地利用状况。
图 1 本研究的示意图。
本文首先解决的问题是如何量化城市功能区的“混合”状态,同时考虑城市功能区的出现频率和人口活动强度。最常用来量化混合状态的数据是兴趣点(POI),它包含功能属性,可以计算混合度。然而,由于POI数据是基于点的,它们不能充分反映人口活动强度。因此,本文还采用了兴趣区域(AOI)数据,它包含功能信息,可以用来计算人口活动。人口活动通过腾讯移动数据来衡量,该数据被识别为热力点。
图 2 武汉三环内 AOI 区域数据的空间分布。
如图2所示,本文展示了研究区域内AOI数据的分布情况,该区域位于中国武汉市,包含超过10,000个实体。具体的计算步骤包括:首先,通过动态人口密度权重pop来评估AOI区域的总人类活动:值越高,该区域的重要性越大。其次,AOI类型的稀缺性以及该AOI对UFZ功能的影响程度(例如引言部分的火车站示例)。本文选择TF-IDF方法来突出不常出现类型的重要性。这是一种统计度量,可以确定一个词在单个文档或文档集合中的重要性,考虑该词的常见性和稀有性。在本文中,它被用来衡量AOI功能在UFZ中的重要性。公式如下:
其中 t 是一个 UFZ 中的 AOI, d 是一个 UFZ, D 是所有 UFZ 的集合(总面积)。TF(t,d) 表示 AOI t 在 UFZ d 中的频率,IDF(t, D) 表示 AOI t 在集合 D 中的逆文档频率。TF(t, d) 可以使用以下公式计算:
其中n t 表示 AOI t 在功能区 d 中出现的次数,|d∈D: t∈d| 表示功能区(AoI 类)中所有 AOI 的总数。在功能区域d中,逆文档频率(IDF, Inverse Document Frequency) IDF(t, D) 可以使用以下公式计算:
其中 |D| 表示研究区域内功能区的总数 D, |d∈D:t∈d| 表示研究区域内包含 AoI 的功能区的数量 t。TF(t,d) 与 IDF(t,D) 的乘积是一个功能类型(AoI 类)在 UFZ 中的 TF-IDF 权重,可用于衡量土地利用的不确定条件。此时,TF-IDF 权重没有考虑人类活动。为了解决这一问题,本文使用 pop×TF×IDF 的公式来为每个功能类型加权。pop i,j (第 i 个功能类别在 j 个 UFZ 中的加权因子)是通过以下公式计算的:
其中 heat i,j,k 和 strengt h i,j,k 分别代表第j 个 UFZ 中的人类活动频率和强度。这个 UFZ 包含 n 个 AoI。人类活动越多,该功能类别的相对重要性就越高。
假设第 i 个功能在该 UFZ(j) 的人口比pop i,j ,将归一化(比例缩放计算)操作设为 Norm,那么功能区 j 中功能 i 的最终加权因子是
然后可以得到每个功能 i 在区域 j 中的归一化概率。此时,UFZ 识别的任务可以描述为一个标签分布学习问题。对于区域 i,目标是学习每个功能标签 Problandi的条件分布,即估计功能分布 。
如前文所述,社会感知与物理感知方法各有其优缺点。通常情况下,在城区观测中,多源数据优于单源数据,因为它们可以相互补充。深度学习模型可以判断哪个来源的特征更为重要。本文主要针对社会感知数据(腾讯位置数据)和物理感知数据(街景图像)。对于前者,本文使用长短时记忆(LSTM)神经网络提取“动态”特征,对于后者基于残差神经网络(ResNet)提取“静态”特征。本文预测不是像 [0,0,1,...,0]那样采用独热编码形式,而是采用概率分布列表的格式。因此本文使用了KL 散度作为损失函数来帮助模型更好地拟合训练数据,模型如下图所示。
图5 基于信息融合的混合UFZ识别方法。
4
实验
研究区域包含1000个社区,这是城市中最小的行政单位。第一组研究数据集是腾讯移动数据,该数据通过超过1亿腾讯软件用户的实时空间位置计算得出,以包含纬度、经度信息和热值信息的点形式存储。已被证明能有效反映人类活动。其空间分辨率为 ,具有高时空分辨率和低获取成本的优势。包括了50小时的数据,总计7,348,690个热力点。图7显示了不同时间人类活动的变化。第二组数据集由75,628张街景图像组成。此外,还收集了大约10,000个AOI,包括11个功能类型。
图7 研究区域内不同时间的人类活动变化。包括工作日和周末。
我们绘制了图11(即不同城市功能区的居民活动变化曲线)。它记录了同一区域面积内大学(a)、住宅区(b)、商业区(c)、旅游区(d)、企业集群(e)、体育场馆(f)、剧院及其周边(g)和医院(h)的人口变化。在此表示中,横轴表示时间,而纵轴反映了相对人数,这表明了每个区域的人类活动强度。
图 11 | 具有相同面积的不同 UFZ 的时间序列热图。面板 a-e 分别展示了模型预测的包含住宅、商业、工业和公共服务功能的区域的概率。面板 a-h 展示了不同功能区域人类活动强度的时序数据。
从图11可以看出,不同城市功能类型下的人类活动序列在时间和强度上存在显著差异。商业区的绝对强度最高,节假日(10月26日)的17:00达到峰值。旅游区的空间密度最低,而大学的人口密度低于住宅区,它们的时间序列变化具有一定的相似性。换句话说,很难将住宅区的序列与其他区域区分开来。这意味着通过社会感知的“动态”特征可以识别不同的城市功能,但仅依赖于此仍然存在不足。图11a, b的时间序列变化相似,需要添加物理感知(街景)数据来区分它们。这也是本文提出多模态数据耦合观测的动机。
基于前文图5提出的方法,对仅使用社会感知数据(腾讯移动)、仅使用物理感知数据(街景数据)以及多模态融合数据进行了比较。在研究区域内,根据 和 的规则,将具有不同人口结构、收入水平和职业分布的功能区随机分为训练集和测试集进行实验。实验结果如表7所示(平均数±标准差)。
表7 不同数据模态在识别UFZ分布方面的准确性。
备注:由于存在多种功能类型,准确性评估采用平均值 标准差的形式。
表7展示了本文的实验的结果。在此表中,多模态融合1和多模态融合2分别代表考虑和不考虑区域之间空间关系时的分布预测。如预期,多模态融合方法在所有指标上相对于单一模态都取得了更好的性能,显示出一定的改进,如平均余弦值(0.539,0.542)和 平均值(0.277,0.264)。最小相似性距离,意味着模型推断的分布接近实际分布。本文的方法在大多数评估指标上超过了竞争基线。结果还表明,信息融合的特征嵌入更有意义,包含了丰富的城市功能信息。这证明了多模态信息融合在城市分析中的巨大潜力,结合不同类型的数据源可以提高城市下游任务的准确性和有效性。与单一模态方法相比,多模态方法在城市功能识别任务中的识别精度提高了约 。
图12 模型识别的各种UFZ分布。面板a-d分别展示了模型预测的包含住宅、商业、工业和公共服务功能的区域的概率。
本文绘制了研究区域中不同区域被预测为各种类别的概率,图12a-d分别显示了预测的区域包含住宅、商业、工业和公共服务功能的概率。与传统城市功能识别方法相比,结果可以更好地量化城市功能的混合程度,并捕捉城市功能的“混合居住”多样性状态。
5
讨论与结论
本文提出了一种用于量化混合城市功能的新框架,并创建了一个关于城市功能分布的真实数据集。该框架在量化和理解细粒度层面的混合城市功能方面做出了几项重要贡献。首先,通过结合功能稀缺性(TF-IDF加权)和人类活动强度(人口加权),该分布更准确地反映了每个区域内不同城市功能的相对重要性,超越了简单的存在-缺失度量。传统的城市功能区域(UFZ)制图在很大程度上将区域视为具有单一主导功能,未能捕捉到城市环境的内在混合状态。
其次,将追踪人类动态的社会感知数据与捕捉建筑环境的物理感知数据相结合,相比单独使用任何一种模式,提供了更全面的视角。结合这些互补的数据流使得模型能够区分那些活动模式相似但视觉/物理特征不同的社区。
第三,将城市功能制图定义为概率分布识别任务,使得我们可以明确量化了区域内不同功能的混合比例。这与大多数城市区域并非由单一功能组成,而是由住宅、商业和其他活动交织在一起的现实情况相吻合。
在这个框架下,规划者可以优化资源分配。通过设计商业、住宅和公共服务设施的分布,他们可以减少高峰时段的交通拥堵和通勤时间。此外,基于人口密度和功能多样性优化公共交通路线和医疗设施,可以改善医疗服务覆盖范围。理解混合土地利用状态和分布使规划者能够将学校、公园和商店共址,提高居住质量。在商业区域合理分配住宅和娱乐设施,满足休闲需求,同时刺激经济发展,增强区域活力。
由于观察规模的限制,本文只关注了少数几种城市功能,而未来的研究应该扩大城市功能标签的数量。本研究的另一个重要局限性是过拟合的潜力,特别是由于深度学习框架仅纳入了大约1,000个社区。这个相对较小的样本量可能导致模型在训练数据上表现良好,但难以有效泛化。在未来的研究中,将汇总更多数据,从而增加输入样本的多样性和数量,这有助于更好地捕捉城市功能分布中的潜在模式。
结束语:之前做城市土地利用,城市功能的相关研究,大部分是简单的进行地理表征,城市功能只是一个简单的下游任务,这样无疑是将计算机模型进行一个迁移应用,而城市功能具有更多的复杂性,呈现“大杂居,小聚居”的状态。这篇文章也受到了黄伟明博士的启发,算是完成了城市感知点-线-面三个尺度的最后一个面尺度的工作,整体结束了博士阶段的内容。
更多阅读:
空间结构如何影响心理恢复?一种基于图神经网络和街景图像的方法
物理-社会空间交互的视角:实现用户下一位置预测的异构图融合网络
是高还是低?使用机器学习和街景图像探索视觉特征下的校园空间注意力恢复效果
一种基于街景图像从建筑环境特征推断社会经济环境的序列到序列方法
知识与拓扑: 基于时间序列街景图像识别城市功能的双重空间依赖图神经网络
迈向以人为本的数字孪生:利用计算机视觉和图模型预测户外舒适度