NeurIPS2024 | 多元概率时间序列预测中的误差相关性建模

文摘 2024-12-11 08:17 北京

论文标题：Multivariate Probabilistic Time Series Forecasting with Correlated Errors

作者：Vincent Z. Zheng(郑治豪), Lijun Sun(孙立君)

机构：麦吉尔大学(Mcgill)

论文链接：https://arxiv.org/abs/2402.01000

代码：https://github.com/rottenivy/mv_pts_correlatederr

Poster session：East Exhibit Hall A-C #4203，Fri 13 Dec 11 a.m. PST — 2 p.m. PST

TL; DR：本文提出了一种全新的方法，解决了当前多元时间序列预测模型中存在的误差自相关和交叉相关问题。

关键词：时间序列预测，概率建模，不确定性量化

点击文末阅读原文跳转本文arXiv链接

注：本文公式和符号大都采用图片格式，手机端深色模式下可能看不清公式内容，请切换为浅色或者点击放大图片查看公式具体内容，或者切换至PC端查看。

创新点概述

误差结构建模：传统深度学习模型通常假设时间序列预测误差是时间独立的，然而实际数据中往往存在误差自相关和交叉相关。我们的方法通过学习多步误差协方差结构，有效提升了不确定性量化的准确性。
低秩加对角参数化：为了在多元时间序列模型中高效建模协方差，我们采用了低秩加对角的参数化方法。这不仅能精确捕捉多元误差的相关性，还能确保计算的可扩展性。
灵活的插件式方法：我们的方法可以无缝应用于现有的自回归概率模型，无需显著增加模型参数量，从而兼顾预测准确性和模型的计算效率。

什么是概率时间序列预测

概率时间序列预测的目标是通过已观测到的多元历史数据及其相关协变量，预测未来个时间步个时间步的时间序列的条件概率分布：，

其中是时刻所有个时间序列变量的集合。该条件分布通常通过自回归模型分解为每个时间步的条件分布之积：

为了捕捉复杂的依赖关系，模型通常使用神经网络将历史信息和协变量编码为状态向量，进而简化为。

现有的自回归模型假设每个时间步的误差是相互独立的，即在给定状态向量的情况下，服从多元高斯分布：

其中，表示均值向量，是协方差矩阵。此模型可以进一步分解为：

其中，是误差项。该模型假设在不同时间步之间是独立的，即对于任意有：。

然而，实际多元时间序列数据往往表现出显著的时间相关性和跨步相关性。残差的交叉协方差（cross-covariance）表明残差中含有重要的信息，这些信息可以用于改进预测质量并更好地量化不确定性（Figure 1）。

方法论

我们的方法建立在自回归模型的基础上，采用高斯分布的误差建模。我们通过引入低秩加对角的协方差矩阵参数化方法来表示多步预测中的误差协方差结构。具体来说，模型的误差项可以表示为。其中，是低维潜变量，是独立的噪声。因此，误差项的相应协方差矩阵可表示为。

核心思想

传统方法往往假设误差之间相互独立，忽略了实际数据中普遍存在的时间依赖性和跨步相关性。我们的研究针对这一局限，通过以下公式重新设计了广义最小二乘（GLS）损失函数，以捕捉多步相关误差：

其中，表示批量内目标时间序列变量的集合，表示动态协方差矩阵，建模了多步预测目标变量的相关性。

批量数据的构建过程

在训练中，我们通过引入滑动窗口机制，构建包含跨步误差相关性的批量数据。具体来说，从时间序列中抽取长度为的切片，其中表示条件范围，表示预测范围。为了考虑跨步误差相关性，我们将这些切片重新组织为一个包含个子切片的批量结构：

为了便于批量建模，我们定义批量内的目标时间序列变量为，以此类推。通过这种方式，批量数据能够覆盖整个预测范围，确保时间依赖性在训练过程中被有效捕捉。

动态协方差矩阵的构建

我们通过一个低秩加对角（Low-rank plus diagonal）的协方差参数化方式，有效地降低了计算复杂度：

是低秩因子矩阵；
是动态相关矩阵，由多个基础核矩阵的加权和生成；
表示独立误差的对角元素。

这种结构通过克罗内克积（Kronecker product）有效建模跨时间步的误差相关性，同时保证模型在训练和推理中的计算效率。

误差校准与滚动预测

在多步预测中，我们进一步利用学到的协方差矩阵对每一步预测进行校准：

其中，是过去时间步的误差观测值，表示为：

在生成预测样本时，首先从上述分布中采样误差项，然后与模型预测的均值向量结合，得到目标变量的采样值：

将此采样值视为观测值后，进入下一个时间步的预测，重复此过程，直至覆盖整个预测范围。通过重复这一过程多次，我们能够生成预测分布的多条轨迹，进一步提升预测的可靠性和准确性。

实验表现

我们在多个公开时间序列数据集上对该方法进行了验证，包括 electricity（电力消耗）、traffic（交通流量）和 solar（太阳能发电）等，实验结果表明：

相较于不考虑误差相关的基线方法，我们的方法在CRPS_sum指标上实现了显著提升：
在 GPVar 基础模型上，平均提升 13.79%；
在 Transformer 基础模型上，平均提升 6.91%。
实验中展示了方法在减少残差自相关和跨步相关方面的优势，显著降低了预测残差的偏差和不确定性。

✨ 适用场景

该方法不仅适用于金融、医疗、能源等领域的时间序列预测，还可以广泛应用于其他需要精确量化不确定性的多元数据场景中。

同时也欢迎来我们的poster session：East Exhibit Hall A-C #4203，Fri 13 Dec 11 a.m. PST — 2 p.m. PST

最新文章

AAAI 2025 | 时间序列（Time Seies）论文总结

AAAI 2025 | 时空数据（Spatial-Temporal）论文总结

年度系列 | 2024 时空数据挖掘研究工作总结

年度系列 | 2024 时空数据与时间序列顶会论文汇总

AAAI 2025 | ChatTime：首个理解与生成统一的时序文本多模态基础模型

ICDE 2024 | TFMAE: 基于时频掩码自编码器的对比时序异常检测

WSDM 2025 | 时间序列（time series）论文总结

ICDM 2024 | 时间序列（Time Series）论文总结

ICDM 2024 | 时空数据（Spatial-Temporal）论文总结

2025 KDD | PatchSTG: 不均匀空间点 Patching 助力大规模时空图预测

ICLR 2025 | 时间序列(Time Series)高分论文总结

ICLR 2025 | 时空数据(Spatial-Temporal)高分论文总结

NeurIPS2024 | 多元概率时间序列预测中的误差相关性建模

KDD2025 | MM-Path: 多模态多粒度时空表征学习

VLDB 2024 | 时间序列（Time Series）论文总结

VLDB 2024 | 时空数据（Spatial-temporal）论文总结

2024 CCF数字交通大会 (12月7-8日北京亦庄)

GIFT-Eval：通用时间序列预测模型评估基准

Moirai-MoE: 稀疏混合专家赋能时间序列基础模型

AI论文速读 | TimesFM-ICF：时间序列基础模型的上下文微调

TimeMixer++：用于通用预测分析的通用时序特征机器

Time-MoE：混合专家的十亿级时间序列基础模型

「万字长文」长序列预测 & 时空预测，你是否被这些问题困扰过？一文带你探索多元时间序列预测的研究进展！

ROSE：领域知识自适应迁移的时间序列预测基础模型

洞见未来 | 时间序列预测还能再进步吗？

论文精读 | 【综述】POI推荐：模型、架构、安全性

AI论文速读 | 2024[SIGIR] LLM4POI：基于大语言模型的下一个兴趣点(POI)推荐

【论文精读】NeurIPS 2024[Spotlight] | CycleNet：通过建模周期模式增强时间序列预测

ROSE（玫瑰）：基于分解频率学习的寄存器辅助通用时间序列预测

PredFormer：Transformers 是有效的时空预测学习器

NeurIPS24 | Time-FFM: 联邦学习赋能的时间序列基座模型

NeurIPS 2024 | 时间序列（Time Series）论文总结

NeurIPS 2024 | 时空数据（Spatial-Temporal）论文总结

VLDB2024 ｜TFB: 全面且公平的时间序列预测方法评测基准

CIKM 2024 | 时空数据(Spatial-temporal)论文总结

KDD 2024时空数据挖掘领域相关论文汇总

ECML PKDD 2024 | 时空数据（Spatial-Temporal）和时间序列（Time series）论文总结

KDD 2024 | 时空数据(Spatio-temporal) Research论文总结

KDD 2024 | 时空数据(Spatio-temporal) ADS论文总结

论文精读|2024[KDD]ImputeFormer: 用于广义时空补全的低秩诱导的Transformer

论文精读 |2024[KDD]UniST: One-for-all城市时空预测模型，预训练+提示统一多种时空场景

AAAI 2024|大模型论文总结（下）

AI论文速读 | 2024[ICML]FlashST：简单通用的流量预测提示微调框架

论文精读 | 2024[KDD]基于多目标强化学习的时空早期预测

SIGMOD 2024 | 时空数据（Spatial-Temporal）和时间序列论文总结

AI论文速读 | 2024[KDD]GinAR—变量缺失的端到端多元时序预测

论文精读 |【综述】生成技术在时空数据挖掘中的应用

论文精读 | 使用异质图学习地理空间区域嵌入表示

ICML 2024 时间序列（Time Series）和时空数据（Spatial-Temporal）论文总结【抢先版】

AAAI 2024 | 大模型（LLM）论文总结

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉