今天给大家分享一篇最近出版在International Journal of Geographical Information Science (IJGIS) 的一篇文章。该杂志主要关注GIS科学,为地理信息科学领域的科学家和专业人员提供了一个交流渠道。
用户位置预测在人类移动性研究中具有很高的价值,在现实生活中也有多种应用。例如,兴趣点(POI)推荐、定向广告和基于位置的内容服务。分析和建模人类移动轨迹的时空模式和影响因素对于预测用户未来可能的访问具有重要作用。用户的空间移动涉及物理和社会空间,他们的移动轨迹形成连接物理和社交空间的复杂关系网络。例如,用户和位置的访问关系,位置间的距离关系、用户间的朋友关系。然而,现有的用户位置预测方法往往忽视了社会影响。从而,用户与地理位置之间的交互隐含的大量信息没有被利用。此外,现有的方法通常采用单一的建模结构,限制了对复杂的时空特征和来自物理和社会空间的多种影响的有效整合。
为此,该研究提出了一种考虑物理和社会交互的新型网络,以用户和空间位置为节点,以它们之间的关系为边,构建了一个异构图,从全局的视角表达了用户移动的物理和社会影响。该图使模型能够利用连接节点和边的信息来推断缺失或未观察到的数据,从而缓解社交媒体数据的稀疏。该模型通过有效整合用户轨迹序列的时间和空间特征来预测用户的未来位置。通过三个社交媒体数据集对所提出的模型进行了验证。实验结果表明,所提出的方法优于最先进的基线模型。这表明考虑用户与地点之间复杂的交互以及物理和社交空间的各种影响非常重要。
HighLights
重点
1.该研究采异构图来建立全局位置和用户之间的关系,为人类移动特征提供从物理空间和社会空间建模的整体视角。
2.该研究提出了一种新颖的PS-HGAN框架来预测个人的下一个位置。使用融合模块有效地集成了从异构图中学习到的集成空间特征和从序列模型中学习到的时间序列特征。此外,通过利用注意力技术的优势,该模型考虑了不同类型的关系以及空间和时间特征的不同影响。
3.该研究在三个不同数据集上进行了实验,结果表明该方法优于基线和最先进的方法。
主题词:下一位置预测、社交媒体、异构图网络、时空融合
ref: He, S., Du, W., Zhang, Y., Chen, L., Chen, Z., & Chen, N. (2024). Next location prediction using heterogeneous graph-based fusion network with physical and social awareness. International Journal of Geographical Information Science, 1–26. https://doi.org/10.1080/13658816.2024.2375725
该方法主要包含以下4个步骤。(1)模型输入为社交媒体采集的用户POI访问记录,该研究通过交通网络将城市区域划分为有限的空间区域(TAZ/Region),将原始POI签到序列映射为TAZ签到序列作为模型的输入。(2)该方法利用用户的历史TAZ签到序列构建用户(User)与Region的交互网络异构图。User和Region被视为不同类型的节点。这个异构图包含五种关系,然后利用 HG 注意网络更新节点特征。这些间接联系(如具有相似偏好的用户或距离较近的地点),使模型可以推断出数据中无法直接观察到的信息,从而弥补数据稀疏的不足。(3)该方法采用基于LSTM的序列模型,考虑时间和距离间隔来模拟用户TAZ签到序列的时间特征。(4)该方法利用注意力层融合前面步骤中学习到的空间和时间特征,然后将所有特征串联起来,得到预测结果。
为了融合物理信息和社会信息,该方法定义的User-Region异构图包含的物种关系如下:(1)Region-Region距离关系:该方法假定如果任意两个区域的质心和之间的距离小于距离临界值,这两个区域就被认为在异构图上相连的。(2)Region-Region转换关系假定两个区域总是在一段时间内被连续访问则这两个区域被认为是相连的。(3)Region-Region时间-周期相似性关系:该关系认为如果两个region在相同的时间段内被持续访问,则这两个地点可能具有相似的属性。(4)User-User相似关系:该方法根据用户访问同一地点的次数来计算他们之间的余弦相似度,从而表示他们之间可能的社交关系。(5)User-Region签到关系:该关系规定如果用户在某个时间访问过某个区域,则在他们之间建立一条有向边。
为了获得User和Region的特征表示向量,该方法使用Lv 等人在2021 年提出的 Simple-HGNN将异构图的特征从高维空间嵌入到低维空间中。这个图注意力模块将图中不同的关系(边)类型信息纳入注意力计算,从而能更有效地处理异构图中的信息,考虑多种关系的不同影响。为了捕捉用户签到行为的时间特征,该方法利用ST-LSTM(Kong and Wu 2018)方法对时间依赖性进行建模。这是一种基于LSTM的方法,可解决梯度消失问题并捕捉长期偏好。为了更好地整合上述两个模型学习到的特征,该方法采用了Wang等人(2022b)提出的时空注意力聚合方法。整合上述模块之后,可以得到代表全局物理和社会空间信息的User和Region的embedding,以及时间序列特征和动态的用户个性化偏好。最后,该方法通过整合这些特征对目的地的影响来计算用户在给定时间访问该区域的概率。(对具体的公式感兴趣请查看原文)
该研究使用了新浪微博、Gowalla和Foursquare 这三个流行的社交媒体平台的真实数据来评估所提出模型的性能。数据分布情况如下:
图. 三个实验数据集的空间分布:
图. 映射后的实验数据集空间分布:
图. 三个实验数据集的时间分布
图6展示了模型学习到的空间特征。
图. 三个实验数据集的时间分布
下表列出了该研究提出的PS-HGAN模型在三个数据集上的表现。与基线模型相比,PS-HGAN在三个数据集上的两个指标均有较好的提升。
下图展示了所提模型在不同阈值参数下的性能。
图. 超参数实验结果
下图展示了该研究的消融实验结果。消融实验结果凸显了考虑用户与位置之间的复杂交互以及来自物理和社会空间的各种影响的重要性。这可能是因为基于异构图的建模方法可以表示用户与位置之间的各种关系,从而对可用数据进行更密集的表示。此外,图中的间接关系使模型能够推断缺失或未观察到的数据,从而减轻数据稀疏性并增强鲁棒性。通过考虑这些复杂的关系,模型提供了更多关于影响移动性最显著的因素的信息。
图. 消融实验结果
预测人类的下一个位置是人类移动性研究中的一个关键问题,在位置服务等实际应用中具有重要价值。先前的研究中社会影响往往被忽视,用户与地理位置之间交互的隐性信息有待进一步探索。该研究提出了一种基于异构图的具有物理和社会意识的新方法PS-HGAN。该模型的主要重点是通过HG网络建立用户与位置之间的复杂交互网络,从而捕获各种高阶地理影响、社会影响和用户偏好的空间依赖关系。此外,该研究使用注意力机制将从图网络获得的空间特征与从序列模型获得的时间特征融合在一起。在三个数据集上进行的大量实验证明了所提出方法的有效性。
长
按
关
注
城市感知计算
ID : sensingcity
认识世界和改造世界。