人类轨迹所表现出的时空结构和规律与城市空间的社会经济有紧密的联系。为此,各种数据挖掘技术被开发并应用于城市规划和管理,例如土地利用分类或聚类、人口估计等。之前挖掘城市轨迹的研究主要分两类,特征工程法和监督学习法。特征工程法依赖于人工提取的轨迹特征,虽然这些特征已被证明是有效的,但它们严重依赖于专家的经验,而且往往忽略了某些类型的潜在信息。常用的监督学习法难以应用于不可用或稀疏标签数据的场景,为一个特定任务学习的模型和特征在其他任务中不一定适用。为解决上述方法局限性,在轨迹挖掘中引入了表示学习方法。表示学习旨在将原始数据转化为有意义的表示,以驱动下游任务。表示学习推动了以无监督的方式利用轨迹数据学习有效区域表示(嵌入)的研究发展。理想情况下,学习到的区域嵌入携带来自人类轨迹的潜在信息,以感知区域的相关性、相似性,从而有利于广泛的下游任务。从人类轨迹中学习有效区域嵌入的一个主要问题是,需要合并哪些类型的潜在信息?本文中,我们提出三个信息视角反映城市区域的语义:(1)转移视角:不同城市位置或区域之间的转移是人类轨迹携带的主要信息,从人类运动和行为的角度反映了城市区域之间的连通性和相关性。区域转移信息可以揭示出长期的依赖关系,比如家庭和工作场所之间的远程通勤。
(2)空间视角:邻近的城市地区或地点通常在许多社会经济因素上具有实质性的相似性和相关性,如人口密度和房价。事实上,空间邻近可以部分捕获转移视角,而明确建模空间视角可以加强相邻城市地区之间的相关性,同时填补未捕获的转移信息。
(3)时间视角:人类轨迹是带有时间戳信息的访问地点序列,是揭示城市位置的时间规律和模式的自然工具。时间规律被认为是城市功能的指示性规律,例如,人们访问居民区和工业区的时间存在明显差异。
基于上述观察,我们提出了一个无监督的多视角轨迹嵌入模型(MTE)学习有效的区域表示,该模型随后被用于各项城市分析任务。MTE结合了神经语言模型Skip-gram以及基于图扩散和Infomax训练目标的无监督图神经网络,其模型架构如下图所示:其中,MTE利用Skip-gram来模拟大量人类轨迹所表现出的人类转移模式,并利用无监督图表示学习来建模空间邻接性和时间模式相似性。在利用下游任务定量评估MTE之前,我们首先通过一个案例来证明MTE对区域表征学习的有效性,即度量区域嵌入的余弦相似性,对相似位置进行探索性搜索。相似性搜索结果可以帮助我们直观地了解不同视角的信息内容和有效性。首先设定一个锚定位置,即位于工业园区中的粉色点,搜索其类似的位置。如果只使用空间视角嵌入(用转移嵌入初始化),我们搜索到两个黄色点作为最相似的位置,它们空间邻近且位于一个居民区。这表明,空间和转移视角的结合主要关注空间接近性,而非功能相似性。如果只使用时间视角嵌入,结果发现两个橙色的位置是最相似的,它们相距很远,却都位于工业园区中。这意味着时间和转移的视角结合强调功能相似性,而通常与空间接近性无关。最后,我们结合空间和时间视角的嵌入,找到位于工业园区的两个蓝点为最相似的位置,在空间上相邻(比黄色点更远),在功能上相似。这说明了MTE的有效性,它平衡了空间接近性和功能相似性。
我们对土地利用分类、人口密度估计和房价预测这三个下游任务进行了广泛的实验。结果表明,MTE大大优于一系列的竞争基线在所有三个任务。一个有趣的发现是不同的信息视角在下游任务上表现出不同程度的有效性,例如在土地利用分类任务中,时间视角比空间视角更有效,而相反在房价预测任务上空间视角表现出比时间视角更强的指示性。
Zhang, Y., Huang,
W., Yao, Y., Gao, S., Cui, L., & Yan, Z. (2024). Urban region
representation learning with human trajectories: a multi-view approach
incorporating transition, spatial, and temporal perspectives. GIScience &
Remote Sensing, 61(1). https://doi.org/10.1080/15481603.2024.2387392点击推送最下方“阅读原文”直达UrbanComp团队官网下载论文。