AAAI 2025 | ChatTime：首个理解与生成统一的时序文本多模态基础模型

文摘 2024-12-27 08:34 北京

标题：ChatTime: A Unified Multimodal Time Series Foundation Model Bridging Numerical and Textual Data

作者：Chengsen Wang, Qi Qi, Jingyu Wang, Haifeng Sun, Zirui Zhuang, Jinming Wu, Lei Zhang, Jianxin Liao

机构：北京邮电大学，鹏城实验室，中国联通

论文：https://arxiv.org/abs/2412.11376

代码：https://github.com/ForestsKing/ChatTime

关键词：多模态问答，时间序列基础模型

TL; DR：本文提出了多模态时间序列模型ChatTime，创新性地将时间序列建模视为“外语”，统一时间序列的生成和理解。实验验证表明，ChatTime在多任务场景下展现了卓越的潜力和实用性。

点击文末阅读原文跳转本文arXiv链接

1 研究背景

预训练大型语言模型的迅猛发展为时间序列领域注入了新的活力。部分研究尝试通过大规模时间序列数据构建通用基础模型，但这种从零开始的训练方法效率低下，且无法整合多模态文本信息。另一些研究则将预训练语言模型的权重融入时间序列框架，但这种方法需要在每个新数据集上重新微调，且缺乏零样本学习能力。此外，这两种方法都无法生成文本输出，限制了其应用范围。那么，如何在计算资源有限的情况下，构建一个既能支持时间序列与文本双模态输入输出，又具备零样本预测推理能力的通用基础模型？

为此，研究者提出了一种创新性建模方法，将时间序列建模视作一种“外语”，并构造了首个开箱即用的多模态时间序列通用基础模型ChatTime。这种建模方法不仅以最小的代价解决了广泛的时间序列问题，还为未来进一步借鉴大型语言模型和多模态研究成果铺平了道路。为验证ChatTime在多任务、多场景下的表现，研究者设计了三个多模态实验，包括零样本预测、上下文辅助预测以及时间序列问答，并创建了专门的多模态数据集以填补该领域的研究空白。实验结果表明，ChatTime展现出卓越的潜力和实用性，为时间序列分析任务提供了全新的解决方案和研究视角。

2 模型架构

通过将时间序列建模为外语，ChatTime赋予了预训练大型语言模型处理时间序列的能力，而无需从零开始训练或修改模型架构。具体而言，ChatTime首先通过缩放、分箱和添加特殊字符将时间序列编码为外语单词。然后，基于扩展后的词表，tokenizer将这些外语词汇与文本一同转换为token id，并输入后续的大型语言模型进一步处理。

缩放：时间序列通常为无界连续域中的实值数据。ChatTime通过使用min-max缩放技术，将这些无界的时间序列实值映射到-1至1的有界范围。在实际推理过程中，预测序列是未知的，因此缩放是基于历史序列的统计值进行的。考虑到预测序列的数值可能超出历史序列范围，研究者将历史序列缩放至-0.5至0.5之间，而剩余的区间则作为预测序列缩放的缓冲区。

分箱：缩放后的时间序列仍为连续的实值，无法直接映射为有限的外语词汇。因此，研究者采用分箱技术将连续实值离散化。具体而言，他们将-1至1的区间均匀划分为10000个分箱，缩放后的每个实值都被映射到相应的分箱中，分箱的中心值作为量化后的离散值。

添加特殊字符：LLMTIME提出了两种方法来逐位tokenize时间序列。然而，这种方法会导致大量token消耗，增加训练和推理的开销。为了解决这一问题，研究者在离散化后的时间序列的首尾添加特殊字符“###”，从而构建新的外语词汇。通过扩展tokenizer的词表，每个数值所消耗的token数量得以大幅减少。

3 微调方法

ChatTime的训练过程分为 Continuous Pre-Training 和 Instruction Fine-Tuning 两个阶段。

在 Continuous Pre-Training 阶段，研究者利用高质量的时间序列切片对 Llama-2-7b-base 进行预训练，得到 ChatTime-1-7b-base。预训练数据来自 Monash 和 TFB 两个开源大型时间序列库，涵盖约 100 个子数据集，涵盖多个领域、不同粒度和长度的时间序列。为了最大化数据集的利用率，研究者采用了五种不同大小的窗口和步长，对原始时间序列进行滑动切片。考虑到时间序列中的大量重复模式及有限的计算资源，研究者对 10M 个原始时间序列切片进行了 K-means 聚类，将其分为 1M 类和 25K 类，每类随机抽取一个样本作为代表，从而构建出高质量的时间序列切片数据集，分别用于继续预训练 (1M) 和下一阶段的指令微调 (25K)。

在 Instruction Fine-Tuning 阶段，研究者使用四种任务的数据集对 ChatTime-1-7b-base 进行微调，最终得到 ChatTime-1-7b-chat。微调数据来自四个任务，每个任务抽取 25K 条样本。首先，为了保留文本推理能力，研究者使用 Alpaca 数据集进行单模态文本问答任务。其次，利用预训练阶段聚类后的 25K 个高质量时间序列切片，进行常规时间序列预测任务。上下文辅助预测和时间序列问答任务涉及时间序列和文本两种模态的相互转换，相关数据集较为稀缺。因此，研究者搜集了三个上下文辅助预测数据集，并合成了一个时间序列问答数据集，填补了这一领域的空白，提供了宝贵的资源。

4 实验效果

为验证ChatTime在多任务、多场景下的表现，研究者设计了三个多模态实验，包括零样本预测、上下文辅助预测以及时间序列问答。实验结果表明，ChatTime展现出卓越的潜力和实用性，为时间序列分析任务提供了全新的解决方案和研究视角。

零样本预测

得益于对现有预训练大型语言模型的微调，而非从零开始训练，ChatTime 在仅使用4%预训练数据的情况下，就达到了先前最先进方法Chronos 99.9%的零样本预测精度。与全样本预测模型相比，ChatTime 也实现了与最先进方法GPT4TS 91.0%相当的预测精度。

上下文辅助预测

在加入文本信息后，ChatTime 和 TGForecaster 在预测性能上都超越了其他基线模型。借助 Llama2 强大的文本推理能力，ChatTime 在无需针对不同数据集和历史长度单独训练的情况下，超越了各场景单独训练的 TGForecaster。此外，使用双模态信息的 ChatTime 显著优于仅使用单模态数值的 ChatTime-，验证了上下文辅助的有效性。

时间序列问答

理解时间序列的典型特征是进行各种时间序列分析任务的基础。尽管通用的预训练大语言模型在文本任务上取得了显著成就，但在时间序列理解上的表现却未能达到同样的水平。ChatTime 基于预训练大型语言模型 Llama2，通过扩充词表并进行微调，成功保留了预训练模型的推理能力，并且在时间序列的典型特征理解方面表现出色。

最新文章

AAAI 2025 | 时间序列（Time Seies）论文总结

AAAI 2025 | 时空数据（Spatial-Temporal）论文总结

年度系列 | 2024 时空数据挖掘研究工作总结

年度系列 | 2024 时空数据与时间序列顶会论文汇总

AAAI 2025 | ChatTime：首个理解与生成统一的时序文本多模态基础模型

ICDE 2024 | TFMAE: 基于时频掩码自编码器的对比时序异常检测

WSDM 2025 | 时间序列（time series）论文总结

ICDM 2024 | 时间序列（Time Series）论文总结

ICDM 2024 | 时空数据（Spatial-Temporal）论文总结

2025 KDD | PatchSTG: 不均匀空间点 Patching 助力大规模时空图预测

ICLR 2025 | 时间序列(Time Series)高分论文总结

ICLR 2025 | 时空数据(Spatial-Temporal)高分论文总结

NeurIPS2024 | 多元概率时间序列预测中的误差相关性建模

KDD2025 | MM-Path: 多模态多粒度时空表征学习

VLDB 2024 | 时间序列（Time Series）论文总结

VLDB 2024 | 时空数据（Spatial-temporal）论文总结

2024 CCF数字交通大会 (12月7-8日北京亦庄)

GIFT-Eval：通用时间序列预测模型评估基准

Moirai-MoE: 稀疏混合专家赋能时间序列基础模型

AI论文速读 | TimesFM-ICF：时间序列基础模型的上下文微调

TimeMixer++：用于通用预测分析的通用时序特征机器

Time-MoE：混合专家的十亿级时间序列基础模型

「万字长文」长序列预测 & 时空预测，你是否被这些问题困扰过？一文带你探索多元时间序列预测的研究进展！

ROSE：领域知识自适应迁移的时间序列预测基础模型

洞见未来 | 时间序列预测还能再进步吗？

论文精读 | 【综述】POI推荐：模型、架构、安全性

AI论文速读 | 2024[SIGIR] LLM4POI：基于大语言模型的下一个兴趣点(POI)推荐

【论文精读】NeurIPS 2024[Spotlight] | CycleNet：通过建模周期模式增强时间序列预测

ROSE（玫瑰）：基于分解频率学习的寄存器辅助通用时间序列预测

PredFormer：Transformers 是有效的时空预测学习器

NeurIPS24 | Time-FFM: 联邦学习赋能的时间序列基座模型

NeurIPS 2024 | 时间序列（Time Series）论文总结

NeurIPS 2024 | 时空数据（Spatial-Temporal）论文总结

VLDB2024 ｜TFB: 全面且公平的时间序列预测方法评测基准

CIKM 2024 | 时空数据(Spatial-temporal)论文总结

KDD 2024时空数据挖掘领域相关论文汇总

ECML PKDD 2024 | 时空数据（Spatial-Temporal）和时间序列（Time series）论文总结

KDD 2024 | 时空数据(Spatio-temporal) Research论文总结

KDD 2024 | 时空数据(Spatio-temporal) ADS论文总结

论文精读|2024[KDD]ImputeFormer: 用于广义时空补全的低秩诱导的Transformer

论文精读 |2024[KDD]UniST: One-for-all城市时空预测模型，预训练+提示统一多种时空场景

AAAI 2024|大模型论文总结（下）

AI论文速读 | 2024[ICML]FlashST：简单通用的流量预测提示微调框架

论文精读 | 2024[KDD]基于多目标强化学习的时空早期预测

SIGMOD 2024 | 时空数据（Spatial-Temporal）和时间序列论文总结

AI论文速读 | 2024[KDD]GinAR—变量缺失的端到端多元时序预测

论文精读 |【综述】生成技术在时空数据挖掘中的应用

论文精读 | 使用异质图学习地理空间区域嵌入表示

ICML 2024 时间序列（Time Series）和时空数据（Spatial-Temporal）论文总结【抢先版】

AAAI 2024 | 大模型（LLM）论文总结

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉