基于双向GRU方法的交通流预测
(Traffic flow prediction using bi-directional gated recurrent unit method)
Shengyou Wang, Chunfu Shao, Jie Zhang, Yan Zheng & Meng Meng
交通流预测是智能交通系统中的关键一环。为了准确捕捉交通流复杂的非线性时间特征,本研究引入双向门循环单元神经网络模型(双向GRU)对其进行研究。与仅能记录前向序列信息的GRU相比,双向GRU模型可以记忆前向和后向时间序列的交通流信息。为证明该模型性能,我们使用了一组来自5个工作日的1小时间隔的真实数据进行训练和验证。本研究使用了四个基线模型,包括差分自回归移动平均模型(ARIMA)、长短时记忆递归神经网络模型(LSTM)、双向长短时记忆递归神经网络模型(Bi-LSTM)和GRU。预测结果证明了双向GRU的优越性能,双向GRU模型的均方根误差(RMSE)为30.38、平均绝对百分比误差(MAPE)为9.88%、平均绝对误差(MAE)为23.35。属于深度学习方法的LSTM、双向LSTM、GRU和双向GRU的预测精度明显高于传统ARIMA模型。此外,预测结果显示,双向GRU和GRU的MAPE预测效果差值较小,仅为0.48%;双向GRU模型在高峰期的预测准确率高于低峰期;同时,双向GRU模型对交通流预测有一定的滞后性。
引用
Wang, S., Shao, C., Zhang, J. et al. Traffic flow prediction using bi-directional gated recurrent unit method. Urban Informatics 1, 16 (2022).
https://doi.org/10.1007/s44212-022-00015-z
研究背景与问题
准确的短时交通流预测对交通管理非常重要,交通流预测结果可为出行需求分析和运营策略制定提供参考,从而减少交通拥堵,提高交通效率和安全性。此外,交通流预测模型也是智能交通系统的关键组成部分之一。一些经典的交通流预测模型,包括Historical Average(HA)模型、ARIMA模型和线性回归(LR)模型已经在实践中得到很好的应用,但缺点是交通流量的波动会严重影响预测效果。一些学者将支持向量回归(SVR)模型和反向传播神经网络(BPNN)模型应用于交通流预测。这些模型对复杂情况有很好的适用性,但模型结构复杂,计算量大,模型参数难以确定。
深度学习方法,是目前短时交通流量预测的领先技术之一。由于短时交通流量预测是通过学习历史观测数据的时间特征进行估算,因此我们主要关注时间序列相关的深度学习方法。如RNN、LSTM、双向LSTM、GRU(Bidirectional Gated Recurrent Unit)等。LSTM可以比RNN可以记忆更长周期的时间特征,能实现更精确的预测效果。随后,双向LSTM被提出,但由于LSTM和双向LSTM需要大量的参数和时间进行训练和拟合,学者们进一步精简了LSTM模型的复杂结构,提出了GRU模型。GRU比LSTM具有更高的预测效率,以及比RNN更高的准确率。与双向LSTM类似,双向GRU被提出并已证明在自然语言领域是有效的,但很少有研究将双向GRU应用于短时交通流量预测,以证明其预测性能。
研究内容
1、包含四个基线模型的对比实验
为了探究双向GRU模型的应用性能,本研究中使用真实的交通流数据对其进行标定和验证,分别在两个场景中测试了预测性能,并比较与ARIMA、LSTM、双向LSTM和GRU模型的预测性能。后三种模型具有相同的基本参数设置,这些模型在训练过程中使用Adam优化器来最小化损失函数,并设置了早期停止,以防止过度拟合。对于ARIMA,使用auto_arima来自动确定最合适的参数,它可以通过多次计算预测和观测交通流量之间的误差,自动找到每个路段的最佳参数。
图1:研究框架图
2、数据集
本次研究中使用了中国郑州市高速公路四个路段在2019年12月2日至6日的五个工作日的交通流量数据。时间间隔为1小时,每个路段有120个数据(5天×24小时)。其中,前3天的数据用于模型训练,后2天的数据用于模型评估。四个路段分别编号为S1、S2、S3和S4。四个路段在五天内的交通流量时间分布如图2所示,可以看出,S2路段中交通流量的平均值和波动性最高,S1路段最低。由于交通流量数据的高峰期和低峰期的数值差异相对较大,因此在模型训练前,对交通流量数据进行了ADF单位根稳定性分析和稳定性处理。
图2:四个路段的交通流量分布图
3、模型性能评估
本研究应用了三个指标:平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)来评估所提出的短时交通流预测模型的预测性能,预测结果见图3。从图3可以看出,双向GRU模型对四个路段整体交通流量预测的RMSE、MAPE和MAE值分别为30.38、9.88%和23.35,比双向LSTM分别低0.87、0.47%和0.99,这表明双向GRU模型的整体预测性能略优于双向LSTM模型。ARIMA的预测结果最差,这表明深度学习方法的四种RNN变体(如LSTM、双向LSTM、GRU、双向GRU)在挖掘时间特征方面比传统的ARIMA模型更好。LSTM和GRU的预测性能相当,但都比双向GRU和双向LSTM差。这说明挖掘历史数据前向和后向时间序列的双向结构对交通流量预测是有用的。此外,我们发现GRU的MAPE为12.36%,比LSTM低2.53%。这表明GRU在短时交通流量预测中比LSTM有更高的预测精度和效率。双向GRU的MAPE(9.88%)比GRU(10.36%)低0.48%,在交通流预测误差方面差距不大。
图3:五个不同模型的性能对比评估
本研究进一步对双向GRU模型在高峰期(17:00-19:00)和低峰期(6:00-8:00)的表现进行了分析,将四个路段的双向GRU模型的预测结果和观测值作比较。从图4可以看出,双向GRU模型在高峰期的RMSE、MAPE和MAE均低于低峰期,这说明双向GRU模型在高峰期时段交通流量预测效果更好。
图4:高峰期和低峰期的数据对比
图5:四个路段的双向GRU预测值和观测值对比
本研究将双向GRU应用于预测城市快速路的交通流量,并采用四个路段的交通流量数据对模型进行训练和评估。研究中引入了ARIMA、LSTM、双向LSTM和GRU这四种模型,与双向GRU模型进行比较,以评估该模型的表现。
1. 双向GRU模型预测结果的均方根误差(RMSE)、平均绝对百分比误差(MAPE)和平均绝对误差(MAE)分别为30.38、9.88%和23.35,低于其他模型,说明双向GRU模型的预测性能最高。
2. 双向LSTM和双向GRU的交通流量预测误差都小于LSTM和GRU,说明挖掘历史数据的前向和后向时间序列的双向结构对交通流量预测有帮助。
3. 深度学习方法(如LSTM、双向LSTM、GRU和双向GRU)的预测精度明显高于传统ARIMA模型。
4. 双向GRU和GRU的平均绝对百分比误差(MAPE)差值为0.48%,预测误差较小。
王晟由,北京交通大学博士。博士研究方向为交通规划与管理,研究兴趣包括交通流理论、交通流量预测、交通状态分析、多源数据交通状态判别、基于轨迹数据的车辆运行演变机理。
邵春福,北京交通大学教授。博士毕业于日本京都大学。研究方向为交通规划、交通管理、智慧交通系统、交通安全。
http://faculty.bjtu.edu.cn/entrans/6347.html张杰,英国布里斯托大学讲师。博士毕业于新加坡南洋理工大学,曾担任英国剑桥大学研究员。他的研究方向为交通运输和供应链系统、数字孪生系统、未来移动性等。
https://www.bristol.ac.uk/people/person/Jie-Zhang-13978420-17c8-4783-9f41-9e7756c9c7cc/郑炎,东南大学博士研究生。他的研究方向为交通规划与管理,具体包括公共交通规划、可变线路公交运营与优化策略、道路交通流状态判别与预测、交通客流预测与道路交通流量预测。
孟梦,英国巴斯大学副教授。博士毕业于北京交通大学,曾担任英国格林威治大学讲师、新加坡南洋理工大学高级研究员。她的研究兴趣包括可持续交通规划、出行行为分析、网络建模和物流管理。
https://researchportal.bath.ac.uk/en/persons/meng-mengEND
编辑:李舒阳、刘乃瑜
审核/指导:孟梦、刘信陶、曹瑞