NeurIPS 2024 | 重新审视时间戳信息在时序预测中的作用

文摘 2024-11-24 17:35 山西

在金融、交通、能源、医疗和气候等领域中，时间戳由于其包含的丰富季节性信息，具有为预测技术提供稳健全局指导的潜力。然而，现有工作主要关注局部观测，时间戳仅被视为一个可选的补充，没有得到充分利用。当从现实世界收集的数据受到污染时，全局信息的缺失会损害这些算法的稳健预测能力。

本文介绍一篇来自 NeurIPS 2024 中的工作，作者提出了 GLAFF 新框架，在该框架中，时间戳被单独建模以捕捉全局依赖关系。作为插件，GLAFF 自适应地调整全局和局部信息的组合权重，能够与任何时间序列预测主干模型无缝协作。在九个真实世界数据集上进行的广泛实验表明，GLAFF 显著提高了广泛使用的主流预测模型的平均性能，提升幅度达到 12.5%，比先前最先进的方法高出 5.5%。

【论文标题】

Rethinking the Power of Timestamps for Robust Time Series Forecasting: A Global-Local Fusion Perspective

【论文地址】

https://arxiv.org/abs/2409.18696

【论文源码】

https://github.com/ForestsKing/GLAFF

研究背景

现有的时间序列预测方法大多依赖于数值型的历史数据，并且假设这些数据的分布是相对稳定的。尽管这类方法能够在捕捉数据中的线性关系和周期性规律方面表现良好，但在面对由外部因素引起的非平稳性和异常情况时，它们往往显得力不从心。

比如，在节假日或特殊事件期间，人们的消费行为、出行模式等会发生显著变化，导致相关指标出现不同于平常的波动。如果模型不能充分考虑这些外部因素的影响，其预测结果可能会偏离实际情况，进而影响决策的准确性。

此外，现实世界中的数据常常因意外事件而遭受污染，如电力系统故障导致的异常高耗电量。缺乏对全局模式的深入理解使得现有方案易受模式异常及数据噪声的影响。

时间戳蕴含丰富的全局性季节特征，本应成为提升预测准确性的宝贵资源。例如，工作日通常会在特定时段迎来交通高峰期。遗憾的是，当前研究大多聚焦于局部观测的数值型数据，仅将时间戳作为可有可无的辅助信息源。

消融研究表明，即使去掉时间戳信息，大部分模型的表现也不会有显著退步，这反映出当前当前对于以时间戳为代表的全局信息利用不足。

图1：交通数据集上的实验结果

模型方法

针对上述问题，作者提出了一种通用框架 GLAFF。作为一款插件，GLAFF 能够无缝集成到任何预测主干之中，借助全局信息增强主流模型的鲁棒预测能力。

相较于通过 early fusion 整合时间戳信息的传统方法，基于 late fusion 的 GLAFF 不仅实现了不同类型信息间的平衡利用，还能有效抵御来自单一数据源的噪声干扰，从而显著增强了整个系统的稳定性和可靠性。

GLAFF 插件的整体架构图2所示。在主干网络根据局部观测提供初始预测后，GLAFF 利用全局信息对齐进行修正。

图2：GLAFF插件的整体架构

具体而言，它先通过 Attention-based Mapper 对包含全局信息的时间戳进行单独建模，并将它们映射到符合标准分布的观测值。随后，为了处理滑动窗口的观测值中存在异常的场景，作者利用 Robust Denormalizer 对初始映射进行逆规范化，从而减轻数据漂移的影响。最后，Adaptive Combiner 在预测窗口内动态调整全局映射和局部预测的组合权重，产生最终的预测结果。

01 Attention-based Mapper

采用 Transformer 模型中的编码器架构，包含了嵌入层、注意力模块以及投影层。类似于多数基于 Transformer 的编码器，GLAFF 通过嵌入层将同一时间的时间戳向量视为一个标记，以描述该向量的属性。

紧随其后，多头自注意力被应用于标记间的交互，以建模时间戳之间的相互依赖，并由前馈网络单独处理以进行序列表示。

最后，使用投影层来获得初始映射结果。借助注意力机制的长距离依赖性和并行计算能力，Attention-based Mapper 得以对以时间戳为代表的全局信息做到更充分的建模。

02 Robust Denormalizer

针对数据漂移现象，GLAFF 对以时间戳为代表的全局信息采取了一种解纠缠的两阶段建模策略。

第一阶段中，由 Attention-based Mapper 直接产生的原始映射值被假定遵循正态分布规律，以此降低建模时间戳与观测值之间依赖的难度。

在第二阶段，基于历史窗口内初始映射值和实际观测值之间的分布偏差，Robust Denormalizer 再分别将初始映射值逆标准化为最终映射值，以减轻数据漂移的影响。标准的逆标准化操作通常考虑均值和方差的差异。

然而，这种方法容易受到极值的影响，在观测数据含有异常时表现得不够鲁棒。作者分别使用中位数和分位数范围替代均值和标准差，使得 Robust Denormalizer 对异常情况更加稳健。

03 Adaptive Combiner

鉴于现实世界的复杂性，模型偏差的数据偏好应该随着在线概念漂移而不断变化。当时间序列模式清晰稳定时，应该给予鲁棒的全局信息更多的关注。当时间序列模式模糊多变时，应该给予灵活的局部信息更多的关注。因此，作者提出了一种数据依赖策略来不断更新模型选择策略，自适应的动态调整全局信息和局部信息的组合权重。

Adaptive Combiner 根据历史窗口内全局映射值和实际观测值之间的偏差，动态调整预测窗口内全局映射值和局部预测值的组合权重。之后，模型根据组合权重对双源信息进行求和，得出最终的预测结果。

实验效果

在九个常用数据集上的实验结果表明，GLAFF 一致地增强了四个广泛使用的主流预测基线的性能，充分证明了其有效性和优越性。

表1：GLAFF与主流基线模型在多元时间序列预测中的误差

除了评估指标之外，预测质量也至关重要。如下图所示，通过两个典型数据集上的对比分析可以看出，GLAFF 生成的结果不仅更加接近实际情况，而且对于局部异常值具有更好的抵抗能力，而其他单独运作的主干模型则容易受到此类扰动的影响。

图3：GLAFF与主流基线模型的预测展示说明

想要了解更多资讯，请扫描下方二维码，关注机器学习研究会

转自：数据派THU

http://mp.weixin.qq.com/s?__biz=MzU1NTUxNTM0Mg==&mid=2247576725&idx=3&sn=b7b77c77315e578fbe58eb3d4af19e51

机器学习研究组订阅

机器学习研究会由百度七剑客雷鸣先生创办，旨在推动AI的技术发展和产业落地。参与组织北大、清华”AI前沿与产业趋势“公开课，广泛的和高校、企业、创业、VC开展合作，自身也参与优秀AI项目的投资和孵化。

最新文章

十年再登巅峰！刚刚，Ilya和GAN之父斩获NeurIPS 2024时间检验奖

数字孪生心脏全球首次实现0.84秒超实时模拟！智源突破计算极限，180倍性能提升

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

Sora半夜泄露3小时，物理效果惊人！奥特曼急拔网线，艺术家抗议被白嫖

NeurIPS 2024 || GLBench: 面向大模型的图学习基准测试集

AI视频两巨头开战！Runway秒生现实大片，Luma动嘴创作电影

打破LLM数据孤岛！Anthropic革命性MCP让大模型解锁全网数据，AGI要来了？

基于LLM Graph Transformer的知识图谱构建技术研究：LangChain框架下的文本-图谱双模式转换机制实践

GAN之父新冠后惊传罹患双重顽疾！听力减退心动过速，全网求医

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

【阿姆斯特丹博士论文】在视觉挑战条件下的多模态学习

Claude 3.5两小时暴虐50多名专家，编程10倍速飙升！但8小时曝出惊人短板

新晋AI编程神器干翻Cursor！首创实时感知无限用，估值12.5亿华人初创震惊AI界

NeurIPS 2024 | 重新审视时间戳信息在时序预测中的作用

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？ML博士直呼太卷后悔转行

英特尔错失AI芯片浪潮，从放弃收购英伟达开始

基于MCMC的贝叶斯营销组合模型评估方法论：系统化诊断、校准及选择的理论框架

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

5年浴火，800余岁巴黎圣母院重生！马斯克激动转发，AI数字建模创奇迹

综述 | 时空图神经网络模型在时间序列预测和分类中的应用

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

预定下一个诺奖级AI？谷歌量子纠错AlphaQubit登Nature，10万次模拟实验创新里程碑

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

逼真到离谱！1000个人类「克隆」进西部世界，AI相似度85%细节太炸裂

Mistral放大招！124B多模态巨无霸登场，免费版ChatGPT震撼突袭

一文解读：时序基础模型的缩放定律

OpenAI「23个黑手党」出走创业，融资近百亿！华人科学家约占1/3

10种数据预处理中的数据泄露模式解析:识别与避免策略

「谍战」开启！基建狂魔马斯克122天交付10万卡超算，对手大恐慌派间谍飞机侦查

14天速成LLM高手！大佬开源学习笔记，GitHub狂揽700星

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

过程奖励模型PRM成版本答案！谷歌DeepMind全自动标注逐步骤奖励PAV，准确率提升8%

Github上的十大RAG(信息检索增强生成)框架

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

ChatGPT深夜两弹更新！macOS版联动三款IDE无缝编程，Windows版全量上线

RAPTOR：多模型融合+层次结构 = 检索性能提升20%，结果还更稳健

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉模型进入上下文时代

又一OpenAI研究员离职！不相信OpenAI能造福世界，AGI使命无比困难

LLM4Rec最新重磅工作：字节跳动序列推荐分层大模型HLLM

OpenAI总裁出走3月终于归来！Greg结束「最长假期」专注重大技术挑战，每周狂肝100小时代码

Transformer打破三十年数学猜想！Meta研究者用AI给出反例，算法杀手攻克数学难题

FoundTS：首个覆盖多场景的时序预测基础模型评测基准

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

AlphaFold3重磅开源，诺奖级AI颠覆世界！GitHub斩获1.8k星，本地即可部署

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技术路线

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

三种Transformer模型中的注意力机制介绍及Pytorch实现：从自注意力到因果自注意力

奥特曼专访自曝OpenAI掌握AGI密钥，2025年降临！1人1万块GPU缔造十亿独角兽

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉