NeurIPS24 | Time-FFM: 联邦学习赋能的时间序列基座模型

文摘 2024-10-14 07:43 北京

论文标题：Time-FFM: Towards LM-Empowered Federated Foundation Model for Time Series Forecasting

作者：Qingxiang Liu（刘庆祥）, Xu Liu（刘旭）, Chenghao Liu（刘成昊）, Qingsong Wen（文青松）, Yuxuan Liang（梁宇轩）

机构：中科院计算所，香港科技大学（广州），新加坡国立大学（NUS），Salesforce，松鼠AI

论文链接：https://arxiv.org/abs/2405.14252

TL; DR：本文介绍了Time-FFM，一种基于联邦学习范式的时序预测基座模型。

关键词：时间序列预测，基座模型，联邦学习，少样本，零样本

点击文末阅读原文跳转本文arXiv链接。

论文概述

近期，构造时序预测基座模型这一方向迸发出了许多相关进展。其核心思想在于联合跨域（cross-domain）时序数据训练同一预测模型[1]。然而不同领域的数据通常源于不同的机构或组织。出于隐私保护的目的，这些数据难以共享并直接用于训练基座模型。本研究旨在构造一种基于联邦学习范式的时序预测基座模型，在保证各domain时序数据不出本地、避免潜在的数据隐私泄露的条件下，增强预测模型对通用时序表征的学习能力，从而提高对未知下游预测任务的泛化性能。

图1 不同预测范式

构造这一联邦基座模型主要存在三个挑战：

异构输入：不同领域的时序数据的维度、历史观测步长不一致
提示词错位：基于领域知识设计的提示词（prompt）导致预训练语言模型（LM）可能对时序输入token的理解能力差、对下游未知领域的鲁棒性差
泛化性和个性化冲突：理想的基座模型应该可以既能够学习到跨领域数据的通用时序表征，又能够针对特定领域生成个性化的预测结果。

这项工作的主要贡献可以总结如下：

首次尝试通过利用LMs的序列推理潜力来构建用于时间序列预测的联邦FM，避免了私有数据的泄露。
提出了Time-FFM基座模型，首先将时间序列数据与自然语言的模态对齐，并自适应地确定prompt来指导LM进行时间序列推理；设计了个性化联邦学习的策略，以在共享通用时间知识和保证定制化预测结果之间取得平衡。
TIME-FFM在主流预测任务中取得了SOTA的预测性能，尤其是在少样本或零样本场景中。

图2 Time-FFM

模型架构

Time-FFM的架构如图2所示，其主要包括四个模块：模态对齐、prompt自适应、LM主干以及个性化预测模块。

模态对齐：通过channel-independent技术，将多元时序拆分成单元时序分别进行处理。然后将每个输入序列划分成若干个步长相等、互不重叠的子序列（称为patch）。每个patch可以类比为NLP任务中的一个单词。最后通过全连接层将patch映射到预训练LM的输入维度。

prompt自适应：为了提高LM对patch token的理解和推理能力，需要针对不同领域的数据设计合理的prompt。目前的相关工作均需要根据领域知识人为构造一些指令作为prompt增强LM对patch token的理解[2][3]。本研究考虑这些指令是对原始时序数据统计属性的描述，而LM仅能获取到经过处理后的patch token。因此更合理的方式应该是站在LM对patch token理解的角度去构造prompt。LM对输入token理解的媒介主要是预训练的词库，因此本研究通过cross-attention去评估词向量和patch token之间的相关性，并选出最相关的k个词向量作为prompt。另一方面，这种方式能够更好地适应到未知领域的时序预测。

LM 主干：在整个训练过程中，该模块处于冻结状态。在本研究的实验中，使用预训练的GPT2的前6层transformer作为主干。

个性化预测模块：为了保证模型能够学习到跨领域数据的通用时序表征并生成领域特定的预测结果，在训练过程中，各领域仅交互模态对齐与prompt自适应这两个模块的模型参数。每个领域保留自己的预测head。

实验效果

本研究在8个经典的时序预测数据集上进行了全面的评估。如下表所示，Time-FFM在所有联邦微调方法中（TY1）能达到最佳的预测效果。和中心化的预测方法（TY2和TY3）相比，Time-FFM也能够取得一定程度的性能提升，表明了Time-FFM这一联邦基座模型的有效性。

图3 预测性能比较

此外，本研究评估了在零样本训练场景下的预测性能。首先使用ETTh1、ETTm1以及ETTm2三个数据集训练Time-FFM，然后在下表三个数据集上评估ETTh1的模型性能。如下表所示，Time-FFM在zero-shot场景中展示了非凡的预测性能。

图4 零样本

参考文献

[1] Liu, X., Hu, J., Li, Y., Diao, S., Liang, Y., Hooi, B., and Zimmermann, R. Unitime: A language-empowered unified model for cross-domain time series forecasting. In Proceedings of the ACM Web Conference 2024, 2024.

[2] Jin, M., Wang, S., Ma, L., Chu, Z., Zhang, J. Y., Shi, X., Chen, P.-Y., Liang, Y., Li, Y.-F., Pan, S., and Wen, Q. Time-LLM: Time series forecasting by reprogramming large language models. In The Twelfth International Conference on Learning Representations, 2024.

[3] Zhou, T., Niu, P., Sun, L., Jin, R., et al. One fits all: Power general time series analysis by pretrained lm. Advances in neural information processing systems, 36, 2024.

最新文章

AAAI 2025 | 时间序列（Time Seies）论文总结

AAAI 2025 | 时空数据（Spatial-Temporal）论文总结

年度系列 | 2024 时空数据挖掘研究工作总结

年度系列 | 2024 时空数据与时间序列顶会论文汇总

AAAI 2025 | ChatTime：首个理解与生成统一的时序文本多模态基础模型

ICDE 2024 | TFMAE: 基于时频掩码自编码器的对比时序异常检测

WSDM 2025 | 时间序列（time series）论文总结

ICDM 2024 | 时间序列（Time Series）论文总结

ICDM 2024 | 时空数据（Spatial-Temporal）论文总结

2025 KDD | PatchSTG: 不均匀空间点 Patching 助力大规模时空图预测

ICLR 2025 | 时间序列(Time Series)高分论文总结

ICLR 2025 | 时空数据(Spatial-Temporal)高分论文总结

NeurIPS2024 | 多元概率时间序列预测中的误差相关性建模

KDD2025 | MM-Path: 多模态多粒度时空表征学习

VLDB 2024 | 时间序列（Time Series）论文总结

VLDB 2024 | 时空数据（Spatial-temporal）论文总结

2024 CCF数字交通大会 (12月7-8日北京亦庄)

GIFT-Eval：通用时间序列预测模型评估基准

Moirai-MoE: 稀疏混合专家赋能时间序列基础模型

AI论文速读 | TimesFM-ICF：时间序列基础模型的上下文微调

TimeMixer++：用于通用预测分析的通用时序特征机器

Time-MoE：混合专家的十亿级时间序列基础模型

「万字长文」长序列预测 & 时空预测，你是否被这些问题困扰过？一文带你探索多元时间序列预测的研究进展！

ROSE：领域知识自适应迁移的时间序列预测基础模型

洞见未来 | 时间序列预测还能再进步吗？

论文精读 | 【综述】POI推荐：模型、架构、安全性

AI论文速读 | 2024[SIGIR] LLM4POI：基于大语言模型的下一个兴趣点(POI)推荐

【论文精读】NeurIPS 2024[Spotlight] | CycleNet：通过建模周期模式增强时间序列预测

ROSE（玫瑰）：基于分解频率学习的寄存器辅助通用时间序列预测

PredFormer：Transformers 是有效的时空预测学习器

NeurIPS24 | Time-FFM: 联邦学习赋能的时间序列基座模型

NeurIPS 2024 | 时间序列（Time Series）论文总结

NeurIPS 2024 | 时空数据（Spatial-Temporal）论文总结

VLDB2024 ｜TFB: 全面且公平的时间序列预测方法评测基准

CIKM 2024 | 时空数据(Spatial-temporal)论文总结

KDD 2024时空数据挖掘领域相关论文汇总

ECML PKDD 2024 | 时空数据（Spatial-Temporal）和时间序列（Time series）论文总结

KDD 2024 | 时空数据(Spatio-temporal) Research论文总结

KDD 2024 | 时空数据(Spatio-temporal) ADS论文总结

论文精读|2024[KDD]ImputeFormer: 用于广义时空补全的低秩诱导的Transformer

论文精读 |2024[KDD]UniST: One-for-all城市时空预测模型，预训练+提示统一多种时空场景

AAAI 2024|大模型论文总结（下）

AI论文速读 | 2024[ICML]FlashST：简单通用的流量预测提示微调框架

论文精读 | 2024[KDD]基于多目标强化学习的时空早期预测

SIGMOD 2024 | 时空数据（Spatial-Temporal）和时间序列论文总结

AI论文速读 | 2024[KDD]GinAR—变量缺失的端到端多元时序预测

论文精读 |【综述】生成技术在时空数据挖掘中的应用

论文精读 | 使用异质图学习地理空间区域嵌入表示

ICML 2024 时间序列（Time Series）和时空数据（Spatial-Temporal）论文总结【抢先版】

AAAI 2024 | 大模型（LLM）论文总结

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉