Research Track
Theme: Urban Data I
Multi-Task Learning for Routing Problem with Cross-Problem Zero-Shot Generalization
作者:Fei Liu, Xi Lin, Zhenkun Wang, Qingfu Zhang, Tong Xialiang, Mingxuan Yuan
机构:香港城市大学
一句话总结:本研究首次通过属性组合的单一模型实现跨问题泛化以解决多种车辆路径问题。
论文简介:车辆路径问题在众多现实世界的应用中扮演着重要角色,几十年来一直是一个重要的研究课题。近年来,神经组合优化方法因其能够利用基于学习的模型解决VRPs而无需手动设计算法,受到了广泛关注。然而,目前的NCO方法通常需要为每个路径问题构建一个单独的模型,这在具有多样化属性的实际问题中极大地限制了其应用。为了解决这一关键挑战,我们在这项工作中首次尝试跨问题泛化。我们将VRPs表示为一组共享的基础属性的不同组合,并通过属性组合使用单一模型同时解决这些问题。通过这种方式,我们提出的模型能够以零样本泛化的方式成功解决具有未见过属性组合的车辆路径问题。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3672040CoSLight: Co-optimizing Collaborator Selection and Decision-making to Enhance Traffic Signal Control
作者:Jingqing Ruan,Ziyue Li,Hua Wei,Haoyuan Jiang,Jiaming Lu,Xuantang Xiong,Hangyu Mao,Rui Zhao
机构:中国科学院自动化研究所,科隆大学,亚利桑那州立大学,百度,复旦大学,快手,上海交通大学
一句话概括:本文提出了一种强化学习方法,通过动态选择最佳协作路口来优化多路口交通信号控制,显著改善了拥堵状况。
论文简介:有效的多路口协作对于基于强化学习的交通信号控制算法在缓解拥堵方面至关重要。现有的工作主要选择邻近路口作为协作对象。然而,很多拥堵,甚至一些大范围的拥堵,是由于非邻近路口未能进行协作造成的。为了解决这些问题,本文提出将协作对象的选择作为需要学习的策略,与原本的信号控制策略同时更新。具体来说,该选择策略能够实时地根据相位和路口层级的特征自适应地选择最佳的协作路口。在合成数据和真实世界数据集上的实验证明了本文所提方法的优越性,与现有最先进的方法相比,取得了显著的改进。代码可在https://github.com/bonaldli/CoSLight获取。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671998Online Preference Weight Estimation Algorithm with Vanishing Regret for Car-Hailing in Road Network
作者:Yucen Gao、Zhehao Zhu、Mingqian Ma、Fei Gao、Hui Gao、Yangguang Shi、Xiaofeng Gao
机构:上海交通大学,滴滴
一句话概括:本文提出了一种基于在线学习的偏好权重逼近算法来解决网约车乘客的道路选择偏好问题。
论文简介:本文使用一组偏好权重估计模型来捕获用户对网约车路径的偏好和他们的历史选择。由于用户偏好可能随时间动态变化,因此在模型上进行实时决策是一项具有挑战性的任务。本文的主要技术贡献是提出了一种基于在线学习的偏好权重逼近(PWC)算法来解决该问题。通过后悔值分析了PWC在最坏情况下的性能,证明了PWC的后悔值是可以消失的。这意味着经过足够长时间的运行后,其整体表现会非常接近于事后选定的最佳固定策略。基于真实数据集的实验验证了该算法的有效性和高效性。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671664Rethinking Order Dispatching in Online Ride-Hailing Platforms
作者:Zhaoxing Yang, Haiming Jin, Guiyun Fan, Min Lu, Yiran Liu, Xinlang Yue, Hao Pan, Zhe Xu, Guobin Wu, Qun Li, Xiaotong Wang, Jiecheng Guo
机构:上海交通大学
一句话总结:本研究通过合作马尔可夫博弈和创新的GRC算法,实现了在线打车平台订单调度的收益最大化和区域价值优化。
论文简介:在线打车平台中,实现最佳的订单调度一直是一个挑战。早期的方法通常在司机-订单二分图中只考虑订单价格作为边权重,导致短视匹配,进而损害平台的收益。为了解决这个问题,最近的研究将订单目的地区域的价值视为司机在该区域平均可获得的长期收入,并将其纳入订单的边权重。然而,这种方法常常导致许多区域司机供应不足,因为不同区域的价值评估差异很大,主要是因为一个区域的价值对其他区域未来司机数量和收益的影响被忽视。本文通过一个合作马尔可夫博弈对这种影响进行建模,该博弈涉及每个价值对平台收益的影响,目标是找到最大化收益的最佳区域价值。为了解决这一问题,我们提出了一种新颖的目标达成协作(GRC)算法,该算法从一个新的目标达成角度实现了信用分配,解决了之前方法中大规模代理的准确信用分配困难以及信用分配与离线强化学习之间的冲突。具体来说,在训练过程中,GRC通过环境模型预测城市的未来状态,并使用评分模型对预测状态进行评分,以判断其盈利水平,其中高分状态被视为目标状态。然后,博弈中的策略被更新,以促进城市尽可能长时间地保持在目标状态。为了评估GRC,我们在几个城市在线部署了一个基线策略三周,以收集真实世界的数据集。在收集的数据集上进行的训练和测试结果表明提出方法在不同城市和高峰期始终优于基线。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3672028CrossLight: Offline-to-Online Reinforcement Learning for Cross-City Traffic Signal Control
作者:Qian Sun, Rui Zha, Le Zhang, Jingbo Zhou, Yu Mei, Zhiling Li, Hui Xiong
机构:香港科技大学,中国科学技术大学,百度,香港科技大学(广州)
一句话总结:本文提出了一种跨城市的交通信号控制范式CrossLight,通过采用离线数据进行元学习并在目标城市进行微调,以解决不同城市间进行交通信号控制策略迁移难的挑战。
论文简介:本文介绍了一种名为CrossLight的新型跨城市交通信号控制(TSC)范式,旨在通过强化学习解决交通拥堵问题,并提高不同城市间TSC策略的可转移性。研究指出,尽管当前的在线或离线学习策略能够为特定城市创建优化的TSC策略,但这些策略在新城市的适用性受到高质量数据获取困难和探索过程成本高昂的限制。CrossLight方法通过在源城市使用离线数据进行元训练,并在目标城市进行自适应微调,以克服这些挑战。通过在四个城市的广泛实验,验证了CrossLight在新城市中以最小的微调迭代次数实现了与现有在线和离线方法的可比性能。这一成果表明,CrossLight框架作为一种创新且强大的范式,为智能交通社区提供了一种可行和有效的解决方案。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671927STONE: A Spatio-temporal OOD Learning Framework Kills Both Spatial and Temporal Shifts
作者:Binwu Wang, Jiaming Ma, Pengkun Wang, Xu Wang, Yudong Zhang, Zhengyang Zhou, Yang Wang
机构:中国科学技术大学
一句话总结:本文提出了一个时空分布外学习框架STONE,通过提取空间和时间语义图,并设计了三种机制,同时处理结构和时间偏移问题,在泛化和可扩展性方面表现出了极具竞争力的性能。
论文简介:交通预测是智能交通系统(ITS)中的一项重要任务,受到工业界和学术界的极大关注。目前已经出现了许多用于交通预测的时空图卷积网络,并取得了显著的成功。然而,这些模型在处理具有结构和时间偏移的分布外(OOD)图数据时,在泛化和可扩展性方面存在局限性。为了应对时空变化的挑战,本文提出了一个名为 STONE 的框架,通过学习不变的节点依赖关系,在多变的环境中实现稳定的性能。STONE 最初采用门控Transformer来提取空间和时间语义图,这两种图分别代表空间和时间依赖关系。接着本文设计了三种技术来解决时空偏移问题。首先,本文引入了一种对结构变化不敏感的Fréchet嵌入方法,这种嵌入空间可以整合图中节点的松散位置依赖关系。其次,本文提出了一种图干预机制,通过扰动两种语义图生成多种不同的环境,而无需任何数据增强,STONE 可以从环境中探索不变的节点表示。最后,本文进一步引入了从探索到外推的风险目标,以增强生成环境的多样性。本文在多个流量数据集上进行了实验,结果表明,本文提出的模型在泛化和可扩展性方面表现出了极具竞争力的性能。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671680UniST: A Prompt-empowered Universal Model for Urban Spatio-temporal Prediction
作者:Yuan Yuan, Jingtao Ding, Jie Feng, Depeng Jin, Yong Li
机构:清华大学
一句话总结:这篇文章介绍了一个通用的城市时空预测模型UniST,它通过利用多样化的时空数据、有效的预训练和知识引导的提示学习,实现了在多种场景下,特别是在少样本和零样本预测方面的优异性能。
论文简介:这篇文章提出了UniST,一个用于城市时空预测的通用模型。UniST的设计灵感来自于大型语言模型,它通过以下几个关键点来实现跨城市时空场景的高效预测:首先,它利用来自不同城市和领域的多样化时空数据进行训练;其次,通过有效的预训练策略,如掩码标记建模(MTM),捕获复杂的时空关系;最后,引入了知识引导的提示学习,通过特定的提示网络动态生成有用的提示,以增强模型对不同数据分布的适应性。UniST的架构包括数据预处理、基于Transformer的编码器-解码器结构、自监督预训练和提示学习四个主要组成部分。在超过20个时空预测场景的广泛实验中,UniST不仅在常规设置下表现出色,尤其在少量样本和零样本学习环境中,UniST展现了其卓越的泛化能力和预测性能。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671662
Theme: Spatio-temporal Data
Self-consistent Deep Geometric Learning for Heterogeneous Multi-source Spatial Point Data Prediction
作者:Dazhou Yu, Xiaoyun Gong, Yun Li, Meikang Qiu, Liang Zhao
机构:埃默里大学,奥古斯塔大学
一句话总结:该论文提出的DMSP框架通过最大化模型估计与目标变量之间的互信息,并引入保真度评分量化数据源质量,提高了环境监测和自然资源管理中多源空间点数据预测的准确性。
论文简介:该论文针对环境监测和自然资源管理等领域的需求,提出了DMSP自监督学习框架,用于多源空间点数据的预测。框架通过最大化模型估计与目标变量间的互信息来对齐不同数据源,并通过保真度评分量化各数据源的可靠性。此外,它采用地理感知图神经网络来捕捉数据点间复杂的空间关系,提高了预测的准确性。DMSP不依赖于真实标签,而是通过自洽的训练方法动态调整模型参数,有效整合了不同质量和位置的多源数据,解决了在缺乏地面真实标签情况下整合多源数据的挑战。在实验部分,该论文通过在两个真实世界的数据集和一个合成数据集上的严格测试,验证了DMSP框架的优越性能,实验结果一致表明其在多个评估指标上超越了现有的最先进方法。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671737MulSTE: A Multi-view Spatio-temporal Learning Framework with Heterogeneous Event Fusion for Demand-supply Prediction
作者:Li Lin, Zhiqiang Lu, Shuai Wang, Yunhuai Liu, Zhiqing Hong, Haotian Wang, Shuai Wang
机构:东南大学,北京大学,罗格斯大学,京东
一句话总结:本文提出了一种基于多视角时空学习框架的解决方案,通过融合异构事件信息来提升需求和供应的预测性能。
论文简介:近年来,集成仓储和配送物流系统在电子商务行业中广泛应用,以应对不断变化的客户需求。因此,购买需求和配送供应能力的预测成为优化运营和提高效率的关键问题。需求和供应之间的互动不仅依赖于它们的经济关系,还受到诸如疫情、促销和节日等日常事件引发的消费者心理影响。虽然现有研究在考虑需求-供应互动的联合预测方面取得了显著进展,但很少涉及多样化事件的影响。在本研究中,我们提出了MulSTE,一种融合异构事件信息的多视角时空学习框架。首先,本文设计了事件融合表示(EFR)模块,用于融合紧急和周期性事件的文本、数值和分类等异构信息。其次,本文提出了多图自适应卷积递归网络(MGACRN),作为时空编码器(ST-Encoder)来捕捉需求、供应和事件的演变特征。第三,设计了事件门控需求-供应交互注意力(EGIA)模块,用于建模事件期间的需求-供应互动。我们在从京东物流和公共网站收集的两个真实世界数据集上进行了评估,实验结果表明,我们的方法在多个指标上优于现有的最新基线方法。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3672030Long-Term Vessel Trajectory Imputation with Physics-Guided Diffusion Probabilistic Model
作者:Zhiwen Zhang,Zipei Fan,Zewu Lv,Xuan Song,Ryosuke Shibasaki
机构:吉林大学,LocationMind Inc.
一句话总结:本文提出了一种基于生成模型的长期船舶轨迹补全框架,利用预训练嵌入和物理引导的判别器,针对海上运输的特性有效填补AIS数据缺失。
论文简介:海上交通管理越来越依赖于地面和卫星网络自动识别系统(AIS)提供的船舶位置信息。然而,AIS 数据缺失的问题可能导致船舶轨迹长期缺失,从而引发有关碰撞风险和非法活动的安全担忧。现有的补全方法通常聚焦于车辆轨迹,难以应对海上运输系统的独特特征和长期缺失数据的情况。为了解决这些挑战,本文提出了一种长期船舶轨迹补全的框架。具体而言,本文首先利用预训练的轨迹嵌入模块来捕捉船舶运动模式,随后引入扩散模型生成缺失轨迹,其中通过Transformer编码观察到的轨迹,将历史船舶轨迹和外部因素作为条件信息。在训练阶段,还设计了一个物理引导的判别器,通过对位置和角度施加运动学约束,以改善补全轨迹的连续性。基于真实AIS数据集的综合实验和分析验证了提出方法的有效性。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3672086RPMixer: Shaking Up Time Series Forecasting with Random Projections for Large Spatial-Temporal Data
作者:Chin-Chia Michael Yeh, Yujie Fan, Xin Dai, Uday Singh Saini, Vivian Lai, Prince Osei Aboagye, Junpeng Wang, Huiyuan Chen, Yan Zheng, Zhongfang Zhuang, Liang Wang, Wei Zhang
机构:Visa Research
一句话总结:本文介绍了一种全MLP模型RPMixer,主要结构是随机投影层的集成。
论文简介:时空预测系统在面对众多现实世界挑战时扮演着至关重要的角色。本文深入探讨了利用一般时间序列预测模型(即不考虑节点间空间关系的模型)来解决时空预测问题的潜力。本文提出了一种名为RPMixer的全多层感知器(all-MLP)时间序列预测架构。选择全多层感知器架构是因为它在最近的时间序列预测基准测试中获得了成功。此外,通过深度神经网络类似于集成模型的行为,网络中的每个单独块的作用类似于集成模型中的基学习器,尤其是在引入恒等映射残差连接时。最后,通过将随机投影层整合到模型中,不仅增加了块输出之间的差异性,还提升了网络的整体性能。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671881Heterogeneity-Informed Meta-Parameter Learning for Spatiotemporal Time Series Forecasting
作者:Zheng Dong, Renhe Jiang, Haotian Gao, Hangchen Liu, Jinliang Deng, Qingsong Wen, Xuan Song
机构:南方科技大学,东京大学,香港科技大学,松鼠AI,吉林大学
一句话总结:本文提出了一种用于时空时间序列预测的异质性参考的元参数学习方案,通过学习空间和时间嵌入隐式地捕捉时空异质性,并参考捕捉到的异质性来进行时空元参数学习,以充分捕捉和利用时空异质性。
论文简介:时空时间序列预测在现实世界的广泛应用中发挥着关键作用。虽然该领域已取得重大进展,但充分捕捉和利用时空异质性仍是一项基本挑战。因此,本文提出了一种新颖的异质性参考的元参数学习方案。具体来说,本文的方法通过学习空间和时间嵌入隐式地捕捉时空异质性,这可以看作是一个聚类过程。然后,本文提出了一种新颖的时空元参数学习范式,从元参数池中学习特定时空参数,而元参数池则考虑了捕捉到的异质性。基于这些想法,本文开发了用于时空时间序列预测的考虑异质性的时空元网络(HimNet)。在五个广泛使用的基准上进行的大量实验表明,本文的方法达到了最先进的性能,同时表现出卓越的可解释性。本文的代码可在 https://github.com/XDZhelheim/HimNet 上查阅。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671961ImputeFormer: Low Rankness-Induced Transformers for Generalizable Spatiotemporal Imputation
作者:Tong Nie, Guoyang Qin, Wei Ma, Yuewen Mei, Jian Sun
机构:同济大学
一句话总结:本文提出了一种低秩性引导的Transformer模型,同时结合了低秩特性和深度模型的优势,用于解决各类稀疏时空数据的高效补全问题。
论文简介:现有的插补解决方案主要包括低秩模型和深度学习模型。前者假设一般的结构先验,但模型容量有限。后者具有显著的表达能力,但缺乏先验知识的基础时空结构。利用这两种范式的优势,我们展示了一个低秩诱导的Transformer,以实现强归纳偏差和高模型表达性之间的平衡。利用时空数据的固有结构,使我们的模型能够学习平衡的信号-噪声表示,使其可推广到各种插补问题。代码和模型开源于:https://github.com/tongnie/imputeformer。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671751Pre-Training Identification of Graph Winning Tickets in Adaptive Spatial-Temporal Graph Neural Networks
作者:Wenying Duan, Tianxiang Fang, Hong Rao, Xiaoxi He
机构:南昌大学,澳门大学
一句话概括:本文提出了一种新方法,通过预训练识别图神经网络中的高效子网络(图中奖票),显著提高了自适应时空图神经网络的计算效率,同时保持了模型性能。
论文简介:本文提出了一种新方法,通过引入源自彩票假设 (Lottery Ticket Hypothesis,LTH) 的图中奖彩票 (Graph Winning Ticket,GWT) 概念,显著提高自适应时空图神经网络 (ASTGNN) 的计算效率。通过在训练之前采用预先确定的星型拓扑作为 GWT,本文在简化图的边和高效信息传播之间取得平衡,在保持高模型性能的同时降低了计算需求。生成自适应时空图的时间和空间计算复杂度都从显著降低到。本文的方法通过消除对详尽训练、剪枝和再训练周期的需求简化了 ASTGNN 部署,并在各种数据集上通过实证证明,有可能以低得多的计算成本实现与完整模型相当的性能。具体来说,本文的方法能够使用配备 48 GB 显存的单张 A6000 在最大规模的时空数据集上训练 ASTGNN,克服了原始训练过程中遇到的内存不足问题,甚至实现了最先进的性能。此外,本文从谱图理论的角度深入研究了 GWT 的有效性,提供了坚实的理论支持。这一进展不仅证明了 ASTGNN 中存在高效子网络,而且拓宽了 LTH 在资源受限环境中的适用性,标志着图神经网络领域的重大进步。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671912
Theme: Reinforcement Learning
DyPS: Dynamic Parameter Sharing in Multi-Agent Reinforcement Learning for Spatio-Temporal Resource Allocation
作者:Jingwei Wang, Qianyue Hao, Wenzhen Huang, Xiaochen Fan, Zhentao Tang, Bin Wang, Jianye Hao, Yong Li
机构:清华大学
一句话概括:本文提出了一种动态参数共享方法,通过自监督学习提取智能体行为特征,在训练过程中动态调整角色划分,从而高效地在大型城市中优化资源分配。
论文简介:在大型城市中,根据资源和需求的时空分布,高效地分配电力、医疗和交通等各种资源以满足市民的生活需求至关重要。此前的研究者已经通过多智能体强化学习(MARL)方法对这些问题进行了大量研究,多个智能体合作调控和分配资源以满足需求。然而,面对大城市中大量的智能体,现有的MARL方法缺乏有效的智能体间参数共享策略,导致计算复杂度过高。高效参数共享面临两个主要挑战:(1) 在强化学习的训练过程中,智能体的行为变化显著,限制了基于训练前固定角色划分的群体参数共享的性能;(2) 智能体的行为形成了复杂的动作轨迹、角色特征,使得在训练过程中动态调整智能体角色划分更加困难。为了解决这些问题,本文提出了动态参数共享(DyPS)方法。本文设计了自监督学习任务,从智能体的动作轨迹中提取隐含的行为特征。基于获得的行为特征,本文提出了一个分层MARL框架,能够在训练过程中动态调整智能体角色划分,从而在相同角色的智能体之间共享参数,降低计算复杂度。此外,本文所提出的框架可以与各种典型的MARL算法结合,包括IPPO、MAPPO等。本文在4个具有代表性的资源分配场景中进行了7个实验,大量结果表明本文所提的方法具有优越的性能,最高比现有最先进的基准方法提高了31%。开源代码可在 https://github.com/tsinghua-fib-lab/DyPS 获取。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3672052STEMO: Early Spatio-temporal Forecasting with Multi-Objective Reinforcement Learning
作者:Wei Shao, Yufan Kang, Ziyan Peng, Xiao Xiao, Lei Wang, Yuhui Yang, Flora D. Salim
机构: CSIRO,皇家墨尔本理工大学,西安电子科技大学,浙江大学,新南威尔士大学
一句话概括:这篇文章介绍了一种基于多目标强化学习的早期时空预测模型STEMO,旨在通过动态调整预测时间来平衡准确性和及时性,以提高对如野火、犯罪和交通拥堵等事件的预测效果。
论文简介:这篇文章详细介绍了一个名为STEMO的新型早期时空预测模型。STEMO模型旨在解决在预测任务中准确性和及时性往往相互冲突的问题。该模型基于多目标强化学习,能够根据给定的偏好实施最优策略或者基于少量样本推断出偏好。STEMO模型主要解决两个挑战:提高早期预测的准确性和为确定每个区域最合适的预测时间提供最优策略。该模型通过多图卷积神经网络(MGCN)和有偏随机游走的节点嵌入技术,增强了对时空数据的动态适应能力,并通过实时反馈进行交互式学习。此外,STEMO还引入了一种方法来发现隐藏的偏好,并使用熵权法来处理非均匀对象尺度或单位的问题。在三个大规模真实世界数据集上的实验结果表明,STEMO在早期时空预测任务中的性能超过了现有方法,展示了其在不同应用场景中的有效性和适用性。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671922
Theme: Anomaly Detection II
Multi-Scale Detection of Anomalous Spatio-Temporal Trajectories in Evolving Trajectory Datasets
作者:Chenhao Wang, Lisi Chen, Shuo Shang, Christian S. Jensen, Panos Kalnis
机构:电子科技大学,奥尔堡大学,阿卜杜拉国王科技大学
一句话概括:本文针对轨迹异常检测开展研究,提出了一种能够在多尺度上检测轨迹时空异常的模型,称为MST-OATD。模型首先计算并融合多尺度上的轨迹时空特征,并在不同尺度上推理正常路线,最后通过轨迹在时空上的重构来检测异常。同时,本文提出一种基于概率和排序的训练集更新策略,在收集到新的轨迹数据时迭代更新训练集,达到实时更新模型的效果。在两个大规模真实数据集上的实验证明了模型的有效性。
论文简介:轨迹是一系列带有时间戳的点位置,用于捕获诸如车辆之类的对象的运动。这种轨迹编码了复杂的空间和时间模式,并提供了关于对象移动性和底层基础设施(通常是移动发生在其中的道路网络)的丰富信息。当不断地包括新的轨迹时,轨迹数据集正在演变。在这种情况下,以在线方式检测异常轨迹的能力是具有许多应用的基本且具有挑战性的功能,基于位置的服务。最先进的解决方案基于轨迹的形状或路线来确定异常,而忽略了由不同采样率或时间偏移引起的潜在异常。本文提出了一种多尺度模型MST-OATD,用于异常流轨迹的检测,该模型同时考虑了轨迹的空间和时间两个方面。该模型的多尺度能力旨在能够在多尺度下提取轨迹特征。此外,为了提高模型的可进化性并应对轨迹模式的变化,模型配备有学习的排序模型,该模型在包括新轨迹时更新训练集。在真实的数据集上的实验结果表明,该模型的性能优于现有的异常检测方法,能够实时检测出异常。此外,学习到的排序模型在使用新到达的轨迹更新训练集时取得了令人满意的结果。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671874
Theme: Sequential Recommendations
ROTAN: A Rotation-based Temporal Attention Network for Time-Specific Next POI Recommendation
作者:Shanshan Feng, Feiyu Meng, Lisi Chen, Shuo Shang, Yew Soon Ong
机构:电子科技大学,A*STAR
一句话概括:本文提出了一种全新的Time2Rotation技术来捕获时间信息,基于Time2Rotation技术,本文提出了一种基于旋转的新型时间注意网络ROTAN用于特定时间的下一个 POI推荐任务。
论文简介:下一个POI推荐最近引起了广泛的研究兴趣,它可以预测用户的后续移动。主要的挑战是如何有效地捕捉用户在签到轨迹中的个性化顺序转换,并且已经开发了各种方法。然而,大多数现有研究在进行下一个POI推荐时忽略了时间信息。为了填补这一空白,我们研究了一个特定时间的下一个POI推荐任务,该任务还结合了目标时间信息。我们提出了一种全新的Time2Rotation技术来捕获时间信息。与传统方法不同,我们将时间段表示为旋转向量,然后执行旋转操作。基于Time2Rotation技术,我们为特定时间的下一个POI推荐任务提出了一种基于旋转的新型时间注意力网络,即ROTAN。ROTAN首先构建一个协作POI转换图,捕捉顺序转换中的不对称时间影响。之后,它将时间信息纳入个人签到轨迹的建模中,提取用户偏好和POI影响的单独表示,以反映它们不同的时间模式。最后,结合目标时间生成推荐。在三个真实数据集上进行了大量的实验,证明了所提出的Time2Rotation技术和ROTAN推荐模型的优势。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671809Diffusion-Based Cloud-Edge-Device Collaborative Learning for Next POI Recommendations
作者:Jing Long, Guanhua Ye, Tong Chen, Yang Wang, Meng Wang, Hongzhi Yin
机构:昆士兰大学,Deep Neural Computing Company,合肥工业大学
一句话概括:本文提出了一种基于扩散模型的云-边缘-设备协同学习框架,旨在降低设备计算负担并提高POI推荐的准确性和适应性。
论文简介:随着基于位置的社交网络(LBSNs)的快速扩展,精准的下一兴趣点(POI)推荐变得尤为重要,通过利用历史签到数据预测用户下一步可能访问的兴趣点。传统的集中式深度神经网络(DNNs)尽管在POI推荐性能上表现出色,但由于隐私问题和时效性不足面临挑战。为应对这些问题,引入了基于设备的POI推荐,利用联邦学习(FL)和去中心化的方法来确保隐私和推荐的时效性。然而,这些方法往往给设备带来计算压力,并难以适应新用户和新区域。本文提出了一种创新的协同学习框架——基于扩散模型的云-边缘-设备协同学习(DCPR),用于下一兴趣点推荐。DCPR通过云-边缘-设备架构提供区域特定且高度个性化的POI推荐,同时减少设备端的计算负担。DCPR通过全局与局部学习过程的独特结合,最大限度地降低了设备端的计算需求。我们通过两个真实世界数据集的评估证明,DCPR在推荐准确性、效率以及适应新用户和新区域方面的性能优于现有方法,标志着设备端POI推荐技术的显著进步。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671743Going Where, by Whom, and at What Time: Next Location Prediction Considering User Preference and Temporal Regularity
作者:Tianao Sun, Ke Fu, Weiming Huang, Kai Zhao, Yongshun Gong, Meng Chen
机构:山东大学,新加坡南洋理工大学
一句话总结:本文提出MCLP基于概率主题模型和多头注意力机制建模用户偏好、时间规律性和序列模式实现用户下一位置预测任务。
论文简介:下一位置预测是人类移动建模的关键任务,可应用于位置推荐、交通规划等多种下游应用中。以往的研究局限于将用户下一位置的到达时间作为关键决定因素,忽略了从历史轨迹中提取用户偏好。为解决以上问题,本文提出了MCLP,通过概率主题模型LDA从用户历史轨迹中学习用户偏好,基于多头注意力机制学习用户下一位置到达时间,以及基于Transformer捕获用户移动模式,联合建模预测用户下一位置。实验结果表明,在模型中加入用户偏好和时间规律信息,可以显著提升下一次位置预测的性能。代码和模型开源于:https://github.com/SUNSTARK/MCLP。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671916
Theme: Urban Data II
ControlTraj: Controllable Trajectory Generation with Topology-Constrained Diffusion Model
作者:Yuanshao Zhu, James Jianqiao Yu, Xiangyu Zhao, Qidong Liu, Yongchao Ye, Wei Chen, Zijian Zhang, Xuetao Wei, Yuxuan Liang
机构:南方科技大学,香港城市大学,香港科技大学(广州)
一句话概括:本文提出了一种基于条件扩散模型的可控轨迹生成框架ControlTraj。
论文简介:轨迹生成可以用于模拟和分析人类移动模式,为城市规划提供数据支持。然而,现有的轨迹生成方法仍处于起步阶段,面临着人类活动的多样性和不可预测性带来的挑战,如真实性、灵活性和普遍性。为了解决这些问题,本文提出了ControlTraj,这是一种具有拓扑约束的扩散模型的可控轨迹生成框架。与之前的方法不同,ControlTraj利用扩散模型生成高保真度的轨迹,同时整合道路网络拓扑的结构约束来指导结果。具体来说,本文开发了一种新型的道路段自编码器,以提取细粒度的道路段嵌入。然后,将这些编码特征与行程属性合并到提出的去噪UNet架构GeoUNet中,从白噪声中合成地理轨迹。通过在三个真实数据环境中的实验,ControlTraj展示了其生成高保真度,适应未被探索地理环境。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671866Communication-efficient Multi-service Mobile Traffic Prediction by Leveraging Cross-service Correlations
作者:Zhiying Feng, Qiong Wu, Xu Chen
机构:中山大学,香港科技大学
一句话概括:本文提出了基于跨服务相关性的通信高效多服务移动流量预测模型,旨在减少数据传输量并提高预测精度。
论文简介:本文提出了一个新的基于跨服务注意力的时空图卷积网络(CsASTGCN),该网络能够同时捕捉时间、空间和跨服务的流量数据相关性。在减少数据传输量的同时,该方法实现了准确的多服务流量预测。此外,本文还提出了基于模型的自适应迁移学习方案,提升新服务模型的训练效率。实验结果表明,该模型在通信效率和预测性能方面显著优于现有方法。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671730Irregular Traffic Time Series Forecasting Based on Asynchronous Spatio-Temporal Graph Convolutional Networks
作者:Weijia Zhang, Le Zhang, Jindong Han, Hao Liu, Yanjie Fu, Jingbo Zhou, Yu Mei, Hui Xiong
机构:香港科技大学、百度研究院、亚利桑那州立大学
一句话概括:针对不规则交通,本文提出一种时间序列预测的异步时空图卷积网络。
论文简介:本文提出一种针对不规则交通时间序列预测的异步时空图卷积网络(ASeer)。首先,提出一种异步图扩散网络来捕获由自适应交通信号调节的异步测量交通状态之间的空间依赖关系;然后,为捕捉不规则交通状态序列之间的时序依赖关系,设计个性化的时间编码来嵌入连续时间信号;接着,提出了一种可转换的时间感知卷积网络,该网络在时间流不一致的序列上采用元滤波器进行时间感知卷积。此外,设计了一种由状态演化单元和半自回归预测器组成的半自回归预测网络,能够高效地预测变长流量序列。
论文链接:https://dl.acm.org/doi/10.1145/3637528.3671665
Profiling Urban Streets: A Semi-Supervised Prediction Model Based on Street View Imagery and Spatial Topology
作者:Meng Chen, Zechen Li, Weiming Huang, Yongshun Gong, Yilong Yin
机构:山东大学
一句话概括:本文提出了一种基于街景图像和空间拓扑的半监督预测模型USPM,用于城市街道功能和社会经济指标的精准预测。
论文简介:随着城市的扩展和多模态城市数据的兴起,利用街景图像分析城市区域在城市规划和管理中愈发重要。本文提出了一种半监督的城市街道剖析模型(USPM)。USPM主要由两个部分组成:街道表征学习和城市街道轮廓提取。USPM结合街景图像的视觉特征和空间拓扑信息,提出了一种基于空间上下文的对比学习方法,用于为每幅街景图像生成特征嵌入,然后使用一个基于LSTM的融合方法对这些图像进行编码,产生一个全面的视觉表示的街道。此外,USPM通过基于SPHINX-V2 的图像字幕来创建街道场景的描述,并利用预先训练的Bert来产生街道的文本表示。最后,使用注意力方法将街道的视觉和文本表示相结合来生成街道表示,从而增强街道功能的分析。最终结合图神经网络进行街道功能和社会经济指标的预测。实验结果表明,USPM在实际城市数据集上的表现显著优于现有基准模型,展现了其在城市剖析任务中的强大潜力。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671918Physics-informed Neural ODE for Post-disaster Mobility Recovery
作者:Jiahao Li, Huandong Wang, Xinlei Chen
机构:清华大学
一句话概括:本文提出了耦合动态图ODE网络(CDGON),在整合现有物理知识的基础上对灾后区域内和区域间人口流动的相互作用进行捕捉,提高了灾后城市人口流动恢复轨迹的预测能力。
论文简介:灾害发生后,城市人口流动急剧下降,随后呈现出复杂的恢复轨迹。有效捕捉和预测这一动态恢复过程,对于制定更有效的灾后恢复战略(如向恢复期较长的地区分配资源)至关重要。现有的灾后流动性恢复模型主要采用基本的数学方法,这些方法严重依赖于简化假设,其有限的参数限制了其全面捕捉流动性恢复模式的能力。针对这一缺陷,本文引入了耦合动态图ODE网络(CDGON)来模拟灾后流动性恢复的复杂动态。本文的模型整合了与灾后人口流动恢复相关的现有物理知识,并纳入了区域内和区域间人口流动之间微妙的相互作用。广泛的实验结果表明,本文的模型能有效捕捉灾后城市人口流动的动态恢复模式,超越了当前动态图预测模型的能力。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3672027DiffCrime: A Multimodal Conditional Diffusion Model for Crime Risk Map Inference
作者:Shuliang Wang, Xinyu Pan, Sijie Ruan, Haoyu Han, Ziyu Wang, Hanning Yuan, Jiabao Zhu, Qi Li
机构:北京理工大学
一句话概括:本文提出了一种多模态条件扩散方法,通过历史犯罪事件、卫星图像和地图图像来推断犯罪风险图。
论文简介:受扩散模型强大且逼真的条件生成能力的启发,本文提出了一种多模态条件扩散方法,即DiffCrime,基于不同领域的数据集(如历史犯罪事件、卫星图像和地图图像)来推断犯罪风险图。它使用了一个历史门控多模态去噪网络,即HamNet,专门用于犯罪风险地图推断。HamNet通过基于门控的历史融合模块强调历史犯罪数据的重要性,并通过时间步感知的模态融合模块自适应地控制多模态条件在不同扩散时间步之间进行融合。在两个真实数据集上的大量实验证明了DiffCrime的有效性。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671843
ADS Track
Theme: Spatiotemporal Applications
Diffusion Model-based Mobile Traffic Generation with Open Data for Network Planning and Optimization
作者:Haoye Chai, Tao Jiang, Li Yu
机构: 清华大学,华中科技大学
一句话概括: 本文提出扩散模型OpenDiff,基于对比学习算法和注意力机制,通过学习公开数据生成移动流量数据。
论文简介: 随着5G网络的快速发展,网络规划和优化越来越重要,生成高保真度的网络流量数据可以帮助网络运营商估计移动用户的网络需求,从而提高网络性能。受公开数据有限的约束,本文提出OpenDiff扩散模型,通过对比学习算法学习遥感图像、POI和人口等公开数据,构建扩散模型的条件信息,还基于注意力融合机制来捕捉网络流量和人类活动特征之间的内在关联,指导生成移动流量数据。分析表明,该模型生成的流量数据具有较高的保真度和较好的可控性,并已成功部署在中国移动的九天人工智能平台上,协助运营商进行网络规划,包括基站部署、节能策略优化、网络资源分配等。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671544LaDe: The First Comprehensive Last-mile Express Dataset from Industry
作者:Lixia Wu, Haomin Wen, Haoyuan Hu, Xiaowei Mao, Yutong Xia, Ergang Shan, Jianbin Zheng, Junhong Lou, Yuxuan Liang, Liuqing Yang, Roger Zimmermann, Youfang Lin, Huaiyu Wan
机构:浙江菜鸟网络技术有限公司,北京交通大学,新加坡国立大学,香港科技大学(广州)
一句话概括:本文提出了首个工业级最后一公里快递数据集LaDe。
论文简介:本文提出了首个工业级最后一公里快递数据集LaDe,其包含来自行业的数百万个真实包裹。LaDe有三个独特的特点:(1) 大规模。它包含21k个快递员在6个月内配送和揽收的10677万个包裹。(2) 全面的信息。它提供原始的包裹信息、任务信息,以及快递员的详细运动轨迹和道路网络。(3) 多样性。该数据集包括来自各种场景的数据,包括包裹揽收和配送,以及来自多个城市的数据,每个城市由于其独特的特征,都有其独特的时空模式。并且,本文通过对每个任务运行几个经典的基线模型来验证三个任务上的LaDe。数据集开源于https://huggingface.co/datasets/Cainiao-AI/LaDe。代码开源于https://github.com/wenhaomin/LaDe。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671548UrbanGPT: Spatio-Temporal Large Language Models
作者:Zhonghang Li, Lianghao Xia, Jiabin Tang, Yong Xu, Lei Shi, Long Xia, Dawei Yin, Chao Huang
机构:香港大学,华南理工大学,百度
一句话概括:将时空依赖编码与大语言模型(LLMs)相结合,以应对城市环境中时空预测,尤其是在数据稀缺的情况下的挑战。
论文简介:UrbanGPT是一种旨在解决城市时空预测问题的大型语言模型。时空预测的目标是预测城市生活各个方面的未来时空模式、趋势和事件,包括交通、人口流动和犯罪率。现有方法虽然在时空数据预测方面取得了一定的成效,但大多依赖大量的标注数据,而这些数据在实际的城市感知场景中往往难以获取。数据稀疏性是一个普遍存在的问题,有时甚至难以收集到任何标注数据,从而进一步加剧了这一问题。因此,构建一个能够在不同时空学习场景中展现强泛化能力的时空模型变得至关重要。受到大语言模型(LLMs)在处理文本数据方面显著成果的启发,UrbanGPT的目标是创建一个能够在广泛的下游城市任务中展现卓越泛化能力的时空LLM。为此,我们提出了UrbanGPT,该模型无缝集成了时空依赖编码器和指令微调范式,使得LLMs能够理解时间和空间之间的复杂相互依赖关系,从而在数据稀疏的情况下也能进行更全面和准确的预测。我们在各种公共数据集上进行了广泛的实验,涵盖不同的时空预测任务,结果一致表明,所设计的UrbanGPT始终优于最先进的基准模型。这些发现突显了在标记数据稀疏的零样本情景下构建大型语言模型进行时空学习的潜力。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671578Spatio-Temporal Consistency Enhanced Differential Network for Interpretable Indoor Temperature Prediction
作者:Dekang Qi, Xiuwen Yi, Chengjie Guo, Yanyong Huang, Junbo Zhang, Tianrui Li, Yu Zheng
机构:西南交通大学,西安电子科技大学,西南财经大学,京东
一句话概括:本文提出了一种用于可解释室内温度预测的时空一致性增强差分网络CONST。
论文简介:室内温度预测对于中央供暖系统的决策至关重要,除了准确性之外,预测应该是可解释的。为此本文提出时空一致性增强差分网络(CONST),此模型主要由一个差分预测模块和一个时空一致性模块组成。第一个模块对影响因素进行建模,通过微分运算求解多重共线性问题。考虑到全局和局部数据分布的异质性,第二个模块表征了时间和空间的一致性,通过多任务学习挖掘通用模式,从而提高预测的可解释性,结合两个模块实现提高预测的可解释性,同时保持高准确性。在包含四个供热站的真实数据集上,此模型在保持高预测准确性的同时,将可解释性指标cRPD提升了8倍以上。论文代码开源于:https://github.com/QiDekang/CONST
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671608
Theme: Urban Mobility
Interpretable Cascading Mixture-of-Experts for Urban Traffic Congestion Prediction
作者:Wenzhao Jiang, Jindong Han, Hao Liu, Tao Tao, Naiqiang Tan, Hui Xiong
机构:香港科技大学(广州),滴滴出行
一句话概括:本文提出了一种可解释的级联专家混合模型(CP-MoE),用于提高城市交通拥堵预测的准确性和鲁棒性。
论文简介:随着快速的城市化进程显著加剧了交通拥堵,迫切需要先进的拥堵预测服务来加强智能交通系统。尽管现有研究已对交通拥堵预测付出诸多努力,但面对存在噪声和数据缺失的实际情况下,大多数模型在处理异构和动态时空依赖性时仍显不足。为此,本文提出了一种新型的拥堵预测专家混合模型(CP-MoE),该模型融合了具有拥堵感知特性的稀疏门控自适应图学习器(MAGLs),以提高模型在不同交通场景中有效捕捉复杂时空依赖性的能力。模型特别设计了两个专门的专家,分别帮助识别交通数据中的稳定趋势和周期性模式。通过将这些专家与MAGLs级联,CP-MoE以一种更加健壮和可解释的方式提供拥堵预测。此外,通过采用序数回归策略促进不同专家之间的有效协作。实验表明,本文提出的方法与最先进的时空预测模型相比具有优越性。CP-MoE已经在滴滴部署,以提高行程时间估计系统的准确性和可靠性。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671507TrajRecovery: An Efficient Vehicle Trajectory Recovery Framework based on Urban-Scale Traffic Camera Records
作者:Dongen Wu, Ziquan Fang, Qichen Sun, Lu Chen, Haiyang Hu, Fei Wang, Yunjun Gao
机构:浙江大学,华为云计算
一句话概括:本文提出了一种基于交通摄像头捕获的车辆快照的新型轨迹恢复系统TrajRecovery,它将从摄像头覆盖的路段中学到的知识推广到未覆盖的路段,并根据历史驾驶行为学习驾驶员特定的驾驶习惯,从而实现车辆级个性化轨迹恢复。
论文简介:精确的车辆轨迹恢复可以为智能城市交通提供不可或缺的数据基础。然而,现有方法面临两个挑战:无法处理全市范围的车辆轨迹,以及模型训练依赖于大量准确的GPS轨迹,导致泛化能力差。为了解决这些问题,本文提出了一种基于交通摄像头捕获的车辆快照的新型轨迹恢复系统,名为TrajRecovery。TrajRecovery由三个主要组件组成:i) 预处理器处理交通摄像头和车辆快照,为轨迹恢复提供必要的数据;ii) 空间传输概率模型(STPM)整合了路况和驾驶员行为,以计算十字路口的转弯概率;iii) Trajectory Generator利用STPM的输出概率来恢复连续且很可能完整的轨迹。本文在来自中国某个城市的两个真实数据集上评估了TrajRecovery,结果表明,与最先进的方法相比,性能有了显著提高。此外,该系统已在华为公司的实际应用中部署。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671558An Offline Meta Black-box Optimization Framework for Adaptive Design of Urban Traffic Light Management Systems
作者:Taeyoung Yun, Kanghoon Lee, Sujin Yun, Ilmyung Kim, Won-Woo Jung, Min-Cheol Kwon, Kyujin Choi, Yoohyeon Lee, Jinkyoo Park
机构:韩国科学技术院
一句话概括:本文提出了一种利用离线元黑箱优化和注意力神经过程动态优化交通灯管理策略的新方法,在复杂路网中有效缓解拥堵,并显著提升了实际交通通行能力。
论文简介:复杂的城市道路网络中,车辆占有率高,经常面临严重的交通拥堵。设计有效的多交通灯管理策略对管理拥堵至关重要。然而,大多数现有的交通灯管理系统依赖于人工决策,这可能无法很好地适应多样化的交通模式。本文深入探讨了交通灯管理系统的两个关键设计组件:相位组合和相位时间分配,这两个组件可以根据不同的交通状况进行动态调整。尽管有许多研究致力于寻找高效的交通灯管理策略,但大多数方法考虑的是固定的交通模式,且仅限于相对较小的道路网络。为克服这些限制,本文提出了一个新颖且实用的框架,使用离线元黑箱优化来优化这些设计组件。首先收集了一个离线元数据集,该数据集由不同交通模式下的设计选择与相应拥堵度量对组成。在收集数据集后,使用注意力神经过程(ANP)来预测所提设计在各种交通模式下对拥堵的影响,并进行良好的不确定性校准。最后,利用贝叶斯优化,以ANP作为代理模型,通过有限的在线模拟为未知交通模式找到最佳设计。实验结果表明,本文所提出的方法在复杂道路网络中,在等待车辆数量方面优于现有最先进的基准方法。将本文提出的方法部署到真实的交通系统中后,交通通行能力相比原有策略提升了4.80%。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671606
FedGTP: Exploiting Inter-Client Spatial Dependency in Federated Graph-based Traffic Prediction
作者:Linghua Yang, Wantong Chen, Xiaoxi He, Shuyue Wei, Yi Xu, Zimu Zhou, Yongxin Tong
机构:北京航空航天大学,香港城市大学
一句话概括:本文介绍了一个新的联邦图学习框架FedGTP,目的是充分利用客户端间的空间依赖关系进行流量预测
论文简介:本文提出了FedGTP,这是一个为基于联邦图的流量预测而设计的学习框架,可在保护隐私的前提下充分利用客户端间的空间依赖关系。FedGTP通过对客户端间空间依赖性的自适应学习取得进步,从而能够更深入地探索空间关系,进而提高预测性能。在隐私保护方面,引入了基于多项式的创新激活分解机制,确保符合GDPR等隐私保护法规。并且在真实世界的交通数据集上进行了广泛的实验,基线比较、消融研究和案例研究表明,FedGTP通过完全恢复客户端间的空间依赖性,超越了现有方法,其 RMSE、MAE 和 MAPE 分别降低了 21.08%、13.48% 和 19.90%。代码仓库地址:https://github.com/LarryHawkingYoung/KDD2024_FedGTP。
论文链接:
https://dl.acm.org/doi/10.1145/3637528.3671613