清华与深大提出TimeBridge,有效处理长期时间序列预测中的非平稳性问题

科技   2024-11-04 18:30   中国  

点击名片

关注并星标

#TSer#

扫下方二维码,加入时序人学术星球
参与算法讨论,获取前沿资料
280+篇专栏笔记,已有270+同学加入学习)

深度学习在多变量时间序列预测领域取得了显著进展。尽管现有方法在处理多元时间序列数据时表现优异,但面对时间序列中的非平稳性,模型的预测效果往往不尽理想。近期针对非平稳时间序列特性的研究提出了多种方法,但大多难以兼顾短期和长期依赖建模,导致在实际应用中性能受限。


本文介绍了清华大学和深圳大学合作开展的时间序列预测研究工作。研究人员提出了一种新的时间序列预测框架(TimeBridge),旨在有效应对时间序列中的非平稳性问题。TimeBridge 主要包含单整注意力模块(Integrated Attention)和协整注意力模块(Cointegrated Attention),分别用于消除短期波动中的非平稳性并捕捉局部依赖,同时保留长期变化的非平稳性以提取不同变量间的协整关系。通过这种双重注意力机制,TimeBridge 实现了短期和长期建模的高效对齐。实验结果表明,TimeBridge在短期与长期预测任务中均表现出色,显著提升了时间序列预测的准确性,尤其在金融数据(如CSI 500和S&P 500指数)中展示了对复杂市场波动的鲁棒性。



【论文标题】

TIMEBRIDGE: NON-STATIONARITY MATTERS FOR LONG-TERM TIME SERIES FORECASTING

【论文地址】

https://arxiv.org/abs/2410.04442

【论文源码】

https://github.com/Hank0626/TimeBridge



研究动机


在多变量时间序列预测中,非平稳性特性为短期和长期建模带来了显著挑战。图1(a)是两条具有长期协整关系的序列在阶段A具有两个随机的波动。图1(b)展示了在短期建模中,非平稳性会导致虚假回归现象。注意力图显示,非平稳的短期波动往往使模型错误地将无关事件联系起来,从而产生虚假相关。这种现象在时间序列中的短期建模中尤为常见,因为外部因素引发的突发变化使模型容易将随机事件视为关联关系,进而影响短期预测的准确性。因此,如何在短期建模中有效消除非平稳性成为提高预测可靠性的重要问题。

图1:非平稳性对短期和长期建模影响的可视化展示

另一方面,图1(c)则揭示了非平稳性在长期建模中的重要性,其保留可以帮助模型识别变量间的协整关系,从而捕捉到多个变量的长期同步变化趋势。相反,如果消除非平稳性,会导致模型忽视这些长期的协整关系,削弱对长期趋势的捕捉能力。因此,在长期预测中,需要保留非平稳性以保持变量间的长期依赖关系,这对有效建模和准确预测多变量时间序列的长期趋势至关重要。图1(d)显示了是否保留非平稳性对短期和长期建模不同的影响。

综上所述,多变量时间序列中的非平稳性在短期和长期建模中扮演着截然不同的角色:短期预测需要消除非平稳性,以避免虚假回归的干扰;而长期预测则依赖于非平稳性来维持变量间的协整关系,捕捉更广泛的趋势。

这一矛盾使得如何在同一模型中平衡非平稳性的消除与保留成为关键挑战。深入理解非平稳性对不同时间尺度的影响,对于提升多变量时间序列预测的精确性和稳定性具有重要意义,并为未来的时序建模方法提供了新的方向。


模型介绍


如图2所示,TimeBridge 巧妙地弥合了非平稳性与依赖性建模在长期时间序列预测中的鸿沟,有效地实现了两者的平衡与融合。


图2:按规范化和依赖建模分类的时间序列预测方法

图3:TimeBridge的具体结构图


01

分块嵌入(Patch Embedding) 


在 TimeBridge 中,首先通过 Patch Embedding 将时间序列数据分割成固定长度的无重叠小块(patch),每个 patch 包含了局部时间段的信息。这些 patch 经过嵌入操作后被映射到高维空间,从而形成时序 token,使模型能够在较小的输入单位上进行特征提取。这种分块嵌入不仅有效降低了计算复杂度,还保证了每个 token 能够携带丰富的时间信息,为后续的注意力机制奠定了基础。

02

单整注意力模块(Integrated Attention) 


在短期依赖建模中,TimeBridge 采用单整注意力模块,专注于去除短期时间序列中的非平稳性。该模块通过对 patch token 应用注意力机制,捕捉相邻时间步之间的关系,减少了短期建模中的虚假回归现象。单整注意力模块聚焦于每个变量的局部动态,确保模型能够准确捕捉短期波动的特性,提升了对局部变化的敏感度和预测鲁棒性。


03

分块下采样(Patch Downsampling) 


为了在长期建模中获得更丰富的全局信息,TimeBridge 在集成注意力模块后加入了 Patch Downsampling 模块。该模块通过对 patch token 进行降采样,将短期信息聚合成更长时间跨度的特征表示,减少了 patch 数量,从而降低了计算复杂度。此步骤确保每个降采样后的 patch 都携带更加浓缩的长期信息,使得模型在后续的长期依赖建模中可以更有效地捕捉跨时间变量的趋势和模式。


04

协整注意力模块(Cointegrated Attention) 


为了准确建模变量之间的长期依赖关系,TimeBridge 在最后引入协整注意力模块。在这一模块中,模型保留了时间序列的非平稳性,通过注意力机制聚焦于不同变量的长时间依赖关系,捕捉它们之间的协整特性。协整注意力不仅能够发现时间序列间的同步变化趋势,还能在长时间尺度上捕获跨变量的关键关系,从而在长期预测中提升模型的准确性和稳定性。



实验结果


  • 长时预测


TimeBridge 与当前最先进的多种方法进行了全面比较,包括 iTransformer、PDF、TimeMixer、PatchTST、Crossformer、FEDformer、ModernTCN、MICN、TimesNet 和 DLinear。为了确保比较的公平性,本文不仅对比了各 baseline 在原文中报告的结果,还进行了输入长度和其他超参数的搜索。实验结果显示,TimeBridge 在各项指标上均取得了最佳表现,尤其在通道数量较多的数据集(如Traffic、Solar和Electricity)上,实现了超过5%的性能提升。


表1:每个baseline正文部分report的结果

表2:Baseline经过输入长度以及其他超参数搜索的结果


  • 短时预测


TimeBridge 同样与多种现有方法进行了对比,包括 iTransformer、PatchTST、DLinear、SCINet 和 TimeMixer 等。由于短时预测任务中数据的时变特性较强,对模型的局部依赖捕捉能力提出了更高要求。下表实验结果表明,TimeBridge 在捕捉短期波动方面表现出色,超越了多种先进模型,尤其在复杂的短期动态环境下展示了显著的鲁棒性和准确性,进一步验证了其在短时预测任务中的卓越性能。


表3:PeMS数据集中的短期预测结果


  • 金融时序预测


TimeBridge 对中美两大股指数据中证500(CSI 500)和标普500(S&P 500)进行了验证。金融时间序列具有显著的短期波动和长周期协同变化特征,对模型的短期和长期建模能力都提出了严格要求。实验表明,TimeBridge 在捕捉短期波动的同时,能够有效识别不同板块间的长周期协整关系,表现出优于传统方法的预测精度和稳定性。在关键指标(如年化收益率、夏普比率等)上,TimeBridge 均取得了显著提升,这表明该模型不仅适用于标准时间序列预测场景,还在复杂的金融市场环境下展现了其强大的适应性和预测性能。


表4:CSI500和S&P500数据集中金融时间序列预测的结果


  • 非平稳性与依赖性建模可视化分析


在多变量时间序列的建模中,非平稳性对短期和长期依赖性建模的影响显著。在短期建模方面,保留非平稳性会导致注意力集中在时间维度上分散(图4a),模型容易将不相关的远端时间步误认为是关联关系,从而产生虚假回归。通过去除非平稳性后,注意力图变得更加集中于相邻的时间步,符合时间序列的因果特性,使模型更好地捕捉短期的局部依赖性,从而提升了在复杂时间序列数据中的鲁棒性和可解释性。

在长期建模方面,非平稳性则有助于捕捉跨变量的协整关系。图4(b)显示,去除非平稳性后,模型在跨变量上的注意力变窄,仅关注少数变量间的依赖,而保留非平稳性则能捕捉到更多元、丰富的跨变量关系。非平稳性序列帮助模型识别协整关系,从而揭示多变量时间序列中的隐藏平衡机制。


图4:非平稳性与依赖性建模可视化分析


  • Weather数据集实际案例分析

本文分析了温度(T)和露点温度(Tdew)之间的关系,这两者在气象变量中具有较强的相互依赖性。露点温度反映了大气湿度,通常与温度密切相关,尤其在没有外部因素(如水汽或热源)干扰的情况下,温度与露点的差异较小,呈现出长期协整关系。然而,温度往往因阳光、天气系统等外部因素而产生更强的短期波动。下图展示的结果表明,在短期建模中去除非平稳性可以有效避免虚假回归现象,而在长期建模中保留非平稳性则有助于捕捉温度和露点之间的协整关系,从而更好地反映出气象变量的动态关联。


图5:天气数据集的温度和露点温度可视化图


扫下方二维码,加入时序人学术星球

星球专注于时间序列领域的知识整理,前沿追踪

提供论文合集、视频课程、问答服务等资源

280+篇专栏笔记,已有270+小伙伴加入

价格随着内容丰富而上涨,早入早享优惠哦~

时间序列学术前沿系列持续更新中 ⛳️

后台回复"讨论",加入讨论组一起交流学习 🏃

往期推荐阅读


Salesforce 推出 Moirai-MoE,新视角设计下一代时序基础模型
一文解读:时序基础模型的缩放定律
FoundTS:首个覆盖多场景的时序预测基础模型评测基准
正常时序转化为图像,进行高效且可解释的多元时序异常检测
Time-MMD:首个涵盖9大主要数据领域的多域多模态时间序列数据集
华东师大团队首创!时间序列异常预测开启全新时序任务
时序异常检测新进展!华为诺亚方舟实验室&华东师大提出首个时序异常检测通用模型
如何处理多频段时序特征?这个Transformer变体显著提升预测效果
PeFAD:边缘设备中高效的联邦异常检测框架
KDD 2024 | 数据驱动的分布偏移检测与自适应
NeurIPS 2024 | 分段时序多分类任务下的一致性学习框架
KDD 2024 | 首个基于 Diffusion 的自监督时序表示方法
港大智慧城市大模型 OpenCity 来袭! 时空预测是否将在 GPT 时代重塑?
KDD 2024 | RHiOTS:评估层级化时序预测算法的可靠性


觉得不错,那就点个在看和赞吧

时序人
专注于时间序列领域下的科研、工业干货分享,紧跟AI+等领域的科技前沿
 最新文章