导 读
本论文于2024年发表于交通领域知名期刊《Transportation Research Part C: Emerging Technologies》上。该论文旨在研究多模式交通系统短时客流预测问题,提出一种新颖的基于多任务学习的模型,该模型能够自适应地学习多模式交通系统中的复杂时空关系,获得多种交通模式之间的交互机制,从而实现精准的多模式交通系统短时客流协同预测。以北京市的多模式交通系统(地铁、公交和出租车)的数据进行大量的实验研究,深入研究多模式交通系统中的时空信息交互机制,结果验证了模型的性能和有效性。
关键词 —
多模式交通系统;短期客流预测;多任务学习;Transformer;深度学习
作 者 / Yongjie Yang, Jinlei Zhang, Lixing Yang, Ziyou Gao
标 题 / Network-wide short-term inflow prediction of the multi-traffic modes system: An adaptive multi-graph convolution and attention mechanism based multitask-learning model
文献来源 / Transportation Research Part C: Emerging Technologies, 2024, 158: 104428.
摘 要
网络范围内的短时客流预测对于高效管理城市交通系统至关重要。当前,各种交通方式相互关联,形成了一个复杂的多模式交通系统。然而,广泛的研究主要集中在单一的交通模式上,忽略了不同交通模式之间的相关性。多模式交通的短时客流预测面临一些挑战:(1)不同交通模式之间的交互机制难以学习,且少有研究探讨这一机制;(2) 由于不同交通模式的空间单元(车站或区域)不同,不同交通模式的数据的数据通常是异质的;(3) 提取多模式交通系统的复杂、动态特征具有挑战性,大多数现有方法应用静态的时空相关性,而不同交通模式之间的真实相关性可能被忽略。为了解决这些挑战,本文提出了一种基于多任务学习的模型,称为MultiMode-former (M2-former),采用编码器-解码器结构,用于多模式交通系统在网络范围内短时客流预测。具体而言,编码器旨在学习和捕捉多模式交通系统的复杂和动态时空相关性,解码器旨在提取目标交通模式的特征并在多交通模式之间共享知识。本文基于中国北京市的真实多交通模式系统数据进行了广泛的实验,结果证明了模型的优越性。此外,还探讨了多交通模式之间的空间和时间信息交互机制,为多交通模式系统的管理和理解提供了一种可靠的方法。
预备知识
本文旨在利用多模式交通系统历史进站客流数据预测多模式交通系统中每种交通方式的未来进站客流。在搭建模型之前,首先需要理解一些相关概念的定义以及多模式交通系统短时客流预测的问题定义。进一步,为了更好地理解本文提出的模型,本节简要回顾了ProbSparse自注意力机制和多图卷积(MGC)。
相关概念
多模式交通系统
自相关图
互相关图
静态关联矩阵
问题定义
ProbSparse注意力机制
多模式交通系统的多图卷积(MGC)
模型框架
本文提出基于自适应多图卷积和注意力机制的多模式交通系统短时客流预测模型(M2-former)。该模型由多个具有编码器-解码器结构的分支组成。每个分支专为特定的交通模式设计。特别地,对于特定的交通模式,编码器用于学习和捕捉多模式交通之间的显性和隐性时空相关性。解码器进一步提取目标交通模式的各个区域(或车站)的客流特征并生成未来客流。M2-former 由 E 层编码器和 D 层解码器组成。任务特定层用于获取每种交通模式的未来客流。此处简要介绍模型的数据处理过程,以交通模式 P 为例:
编码器的输入是历史客流数据 和交通模式 P 的多关系图 和 ,其中表示交通模式 P 的节点数,L 表示历史时间步。历史客流数据 也记作 。
和多关系图被输入到 E 个相同的编码器层中,以提取多交通模式之间的时空相关性。每个编码器层由两部分组成,即 MTR-A 和 MSR-MGC。具体来说,在第 l 层编码器中,MTR-A 的输入是第 (l-1) 层编码器的输出和第 (l-1) 层中所有交通模式的输出,记作,其中。MSR-MGC 的输入是第 (l-1) 层编码器的输出和多关系图和。MTR-A 和 MSR-MGC 的输出被输入融合层,以生成第 l 层编码器的输出。
解码器的输入包括三个部分:历史客流数据、多关系图和、以及第 (i-1) 层解码器的输出,记作。最后一层编码器的输出也记作。解码器利用 STR-A 和 SSR-MGC 来充分提取交通模式 P 的时空特征。经过 D 个相同的解码器层处理后,最后一层解码器的输出 (X_{P,D}^{de} ∈ R^{S_P×L}) 被输入任务特定层,以生成交通模式 P 的所有区域(或车站)的未来客流。
编码器:学习多模式交通系统中的复杂相关性
多时态关系注意力机制(MTR-A),旨在提取多交通模式之间的时间相关性,由多交通模式ProbSparse注意机制(MTM-)和基于注意力的聚合块(AAB)组成。
多空间关系自适应MGC(MSR-MGC),用于获取多交通模式之间的显性和隐性空间相关性。
1. 多时态关系注意力机制(MTR-A)
多模式ProbSparse注意力机制(MTM-)
基于注意力机制的聚合模块(AAB)
2. 多空间关系自适应MGC(MSR-MGC)
解码器:知识共享和目标交通模式特征提取
自时间关系注意力机制(STR-A):旨在提取目标交通模式的自时间相关性,由两个注意机制堆叠而成,即因果ProbSparse注意机制和卷积多头注意机制。 自空间关系标准MGC(SSR-MGC):用于提取自空间相关性并在不同交通模式之间共享知识。
1. 自时间关系注意力机制(STR-A)
因果Probsparse注意力机制(CPS-A)
卷积多头注意力机制
2. 自空间关系标准MGC(SSR-MGC)
数值实验
本文选择均方误差(MSE)作为损失函数,选择均方根误差(RMSE)、平均绝对误差(MAE)以及加权平均绝对百分比误差(WMAPE)作为评价指标,衡量模型预测效果。本文在中国北京市的多交通模式数据集上评估了M2-former和12种基线模型。此外,本文还分析了超参数的影响,并深入探讨了 M2-former 关键组件的重要性。
数据集
出租车交通流量数据集
公交车流入数据集
地铁流入数据集
实验结果
与基线模型比较
站点级预测效果
消融实验
MTM-A:MTR-A中的多模式ProbSparse注意力机制能够提取不同交通模式对目标交通模式的相关性。该模型直接利用目标交通模式的历史流入量生成编码器中的自相关特征图。 AAB:为了探索注意力聚合块的用处,该模型通过简单地将不同交通模式的特征图相加,而不是使用权重来平衡不同特征图中不同节点的重要性。 CPS-A:为了探索因果ProbSparse自注意力机制的有效性,该模型移除了因果ProbSparse注意机制的模型。 Conv-A:该模型用完全注意力取代了卷积多头注意机制,以了解卷积操作是否影响模型性能。
MSR-MGC:本节移除了MSR-MGC,因此编码器仅包含MTR-A。MSR-MGC的有效性将在下文中进一步讨论。 SSR-MGC:本节移除了SSR-MGC,因此解码器利用STR-A生成多模式交通系统的未来流入量。
单模式预测与多模式预测
基于MTR-A分析多模式交通系统时间信息交互机制
基于MSR-MGC分析多模式交通系统空间信息交互机制
采用不同的出租车数据聚合方式
总结
本文主要关注多模式交通系统在网络范围内短期客流预测,提出了一种新颖的模型 M2-former,以协同考虑多种交通模式。本文的结论总结如下:
M2-former与单模式预测模型的比较表明,协同考虑多种交通模式可以提高所有交通模式的预测性能。 所提出的MSR-MGC和MTR-A能够自适应地提取多交通模式之间的空间和时间信息交互机制。这些组件可以为不同的交通模式分配权重并过滤时空信息,从而实现信息交互机制并提高预测性能。 大量实验证明 M2-former的优越性。根据基线模型的比较,与最佳基线模型相比,所提出模型在所有交通模式中的改进分别为3.92%、4.29%和4.04%(RMSE、MAE 和 WMAPE)。
END
注意:本文为交通与优化(OR_Transportation)公众号团队原创发布,如需转载请在文章开头标明文章来源【交通与优化】(ID:OR_Transportation)与作者信息,并且不得修改文章标题和内容。
编辑:张婧慧
微信公众号后台回复
加群:加入全球华人OR|AI|DS社区硕博微信学术群
资料:免费获得大量运筹学相关学习资料
人才库:加入运筹精英人才库,获得独家职位推荐
电子书:免费获取平台小编独家创作的优化理论、运筹实践和数据科学电子书,持续更新中ing...
加入我们:加入「运筹OR帷幄」,参与内容创作平台运营
知识星球:加入「运筹OR帷幄」数据算法社区,免费参与每周「领读计划」、「行业inTalk」、「OR会客厅」等直播活动,与数百位签约大V进行在线交流
文章须知
文章作者:交通与优化
责任编辑:江镕行
微信编辑:疑疑
文章转载自『交通与优化』公众号,原文链接:论文拾萃 | 基于自适应多图卷积和注意力机制的多模式交通系统短时客流预测模型
关注我们
FOLLOW US