必看！时序大模型的发展、玩家与效果对比

文摘 2024-08-19 17:20 北京

一文读懂前沿技术：时序大模型的演进与未来！

历经 2023 年的“千模大战”后，大模型的风也在今年刮到了时间序列领域。

从最初的时序数据分析应用到如今的时序大模型，时序数据分析迎来哪些发展历程，国内外有哪些时序大模型玩家，各个时序大模型应用效果又如何？

本文将一一解答……

演进历程

时序大模型无疑是一个新兴领域。

2018 年以前，业内更多还是采用统计模型来分析时序数据。2018 年之后，针对时间序列的深度模型研究开始蓬勃发展，并出现了一般时间序列分析与深度预测模型两类成果：

一般时间序列分析主要基于经典统计学方法，如自回归滑动平均、趋势分析、状态空间模型以及谱分析等等。这些方法通过数学公式描述时间点之间的相互关系，分析时间序列的组成逻辑，或者建模时间序列的生成过程。

深度预测模型则通过设计神经网络结构，从海量数据中学习复杂模式和特征，进一步解决传统时序分析技术难以处理的若干挑战，比如海量数据建模、复杂时序变化、多变量关联、分析模型的泛化性等等。

然而，时间序列的多样性、非平稳等特性，对深度学习方法的模型容量和泛化能力提出了严峻挑战。同时，依赖数据驱动训练的深度学习模型，仅能应用于单一场景与任务，制约了其在丰富现实场景中的有效应用。

因此，到了 2024 年，时序分析模型领域出现了一个新的分支——时序大模型，该技术在模型通用性、下游任务适应性、可扩展性、预测准确性等方向实现进一步突破。

具体而言，目前针对时序大模型的研究主要有两个方向：

第一个方向是大型语言模型（LLM）的应用。这类模型在自然语言处理（NLP）任务中表现出色，现在也被转用于分析时序数据，以利用其卓越的模式识别和预测能力。

第二个方向是原生时序大模型的研发。这类模型专门针对时序数据特性量身设计，考虑了时间序列数据的连续性、周期性、时间依赖性等关键属性，能够提供更为精确、高效的分析预测。

典型成果

在时序大模型的发展历程中，众多具有全球影响力的企业扮演着不可或缺的角色，部分企业开发的时序大模型如下：

TimesFM：由 Google 开源，是一种预训练的仅解码器基础模型，优化了对上下文长度最多 512 个时间点和任何时间跨度的单变量时间序列预测。

MOIRAI：由 Salesforce 开源，通用模型设计使预训练模型有能力进行多变量时间序列预测，具备零样本预测能力。
Chronos：由 Amazon 开源，通过对时间序列数据进行标记，并使用交叉熵损失函数在这些标记化的序列上训练语言模型。

TimeGPT-1：Nixtla 研发，可以实现 API 调用。其利用历史值窗口生成预测，通过添加本地位置编码丰富输入信息，且允许用户利用自己的数据对于模型进行微调。

除了上述由国外互联网大厂主导的成果，还有来自高校及开发者研发的时序大模型，例如：

MOMENT：通过在大量公共时间序列数据上进行掩码序列预测任务，进行模型预训练。

Lag-Llama：为单变量概率预测而构建的模型，使用数据滞后期等先验知识编码时间序列数据，并提升模型泛化能力。

ForecastPFN：旨在解决零样本时间序列预测问题，通过在预定趋势和季节性生成的合成数据上进行训练，来分析未来数据趋势。

国内对时序大模型的技术研发也愈加深入，并已经自研出在泛化性、可扩展性、预测表现上等方面表现优异的时序大模型，其中的代表便是开源原生时序大模型 Timer。

Timer 模型和时序数据库 IoTDB 一样，发源于清华大学软件学院，针对时间序列领域，拥有基于大规模预训练的丰富知识库，具备可观的分析能力和对真实世界数据的理解能力。通过依靠显著的少样本能力对特定任务进行微调，Timer 模型被赋予了强大的通用能力，能够处理多样化的下游任务。

目前，Timer 模型已经内置在 IoTDB 的 AINode 中，用户能够在 IoTDB 中非常方便地进行调用。得益于 Timer 模型的优异性能，IoTDB 可以有效地为时序预测、数据填补、异常检测等工业场景提供解决方案。

Timer 模型的部分极低样本使用率下的微调结果

来源：ICML 2024 论文《Timer: Generative Pre-trained Transformers Are Large Time Series Models》

上述提到的时序大模型，其结构、模型特点、支持应用场景等重点特征如下：

性能对比

体现时序大模型性能的典型场景之一便是零样本预测任务，也就是在没有针对特定数据集进行训练的情况下，直接对时间序列进行预测。

这是因为，时序数据体量庞大、写入并发量高，完全基于历史数据训练模型是较为困难的。处理零样本预测任务将直接决定模型的泛化使用能力，需要模型具备强大的特征提取能力。

下图为在 7 个真实数据集中，多类大模型的零样本预测任务结果对比。图中的指标为 MSE（预测均方误差），该值越小，表示模型的预测值与实际观测值之间的差异越小，预测的准确性越高。

可以看到，Timer 模型在多个数据集的表现均名列前三位，在平均排名值中（模型在每个数据集上的 Top1 次数/参与比较的数据集总数），Timer 模型也取得了综合最优的水平。

值得一提的是，Timer 的性能优势不仅体现于零样本预测，还包括少样本微调、任务通用性、可扩展性、对于可变序列长度的适配性等方向。

来源：ICML 2024 论文《Timer: Generative Pre-trained Transformers Are Large Time Series Models》

总结

伴随着越来越多研究成果的集中发布，我们能够感受到时序大模型正在迅速发展，在多个领域和应用中展现出巨大的潜力。

未来，随着技术的不断进步，预计将会有更多创新的方法和实践出现，我们期待以 Timer 模型为代表的时序大模型实现性能更大幅度的提升！

规上企业应用实例

能源电力：中核武汉｜国网信通产业集团｜华润电力｜大唐先一｜上海电气国轩｜清安储能｜太极股份｜绍兴安瑞思

航天航空：中航机载共性｜北邮一号卫星

钢铁冶炼：宝武钢铁｜中冶赛迪

交通运输：中车四方｜长安汽车｜城建智控｜德国铁路

智慧工厂与物联：PCB 龙头企业｜博世力士乐｜德国宝马｜京东｜昆仑数据｜怡养科技

http://mp.weixin.qq.com/s?__biz=MzU4NjU4NTUxNA==&mid=2247499235&idx=1&sn=84e8ef3cc8913c904a16b88ed2ec7b2a

Apache IoTDB

一款高吞吐、高压缩、高可用、支持存储、管理与分析的物联网原生开源时序数据库系统软件。

最新文章

【IoTDB 线上小课 09】时序大模型的发展历程，出现高性能国产成果？

Apache IoTDB v1.3.3 发布｜新增数据订阅，DataNode 主动监听并加载 TsFile 等功能

IoTDB 航空航天解决方案：从制造到试飞，助力国之重器翱翔长空

实现高效运行管理：如何使用 NSSM 工具将 IoTDB 注册为 Windows 系统服务

替换OpenTSDB和HBase，宝武集团使用IoTDB助力钢铁设备智能运维

IoTDB 与 HBase 对比详解：架构、功能与性能

时序数据库是什么：概念、特点与分类简析

【活动预告】Apache TsFile 干货总结在 COSCON'24 等你~！

IoTDB 探索季活动｜大疆无人机等你来拿

【IoTDB 线上小课 08】时序数据库融合 AI，带来的效果竟然是？

国际开发者成为 Apache IoTDB Committer，新视角谈开源经验！

如何评估和观测 IoTDB 所需的网络带宽？

节省60%资源，替换Cassandra，北京城建智控牵手IoTDB为地铁运行保驾护航

专业期刊《Java aktuell》：使用Apache TsFile和Apache IoTDB对时序数据进行分布式数据采集

IoTDB 论文入选三大数据库顶会：ICDE、SIGMOD、VLDB 收录自研成果！

【功能详解】IoTDB 与 ThingsBoard 成功集成！

【IoTDB 线上小课 07】多类写入接口，快速易懂的“说明书”！

VLDB 2024 圆桌会议回顾：展望物联网与 AI 时代的时序数据库

Apache IoTDB 毕业四周年快乐！龙年 T 恤别错过

阿里云AMD护航，天谋科技携IoTDB登顶TPCx-IoT国际权威榜单

邀请函 | Pulsar Meetup 北京 2024

IoTDB 端边云同步：SQL 一键搞定 5 大常见场景

时序数据库 IoTDB 为什么选择 TPCx-IoT 基准测评？

央视报道时序数据库 IoTDB 性能刷新世界记录！

源于清华的开源时序数据库IoTDB刷新世界纪录

IoTDB 在顶级会议 VLDB 2024：四篇最新论文入选，特邀做 TPC 报告与讨论会！

IoTDB 如何有效实现磁盘 I/O 监控和优化？

关于 IoTDB 的疑问，我们这次有奖征集！

【IoTDB 线上小课 06】列式写入=时序数据写入性能“利器”？

云上集成时序数据库 IoTDB，海量储能数据实现高效处理与实时分析

必看！时序大模型的发展、玩家与效果对比

一次性揭秘 IoTDB 端边云同步的 7 大特性！

创业过去1024天，我后悔了吗？

【活动预告】第四届西门子工业边缘生态大会，Apache IoTDB 来啦！

IoTDB 单机/双活/集群部署的区别和适用场景

【活动预告】研讨会+开源集市，IoTDB “登录” GOTC 2024！

IoTDB组件AI Node发布9个月，如何使用你了解了吗？

IoTDB 集群性能优化：内存配置详解

可信数据库发展大会回顾 | 天谋科技乔嘉林：Apache TsFile & IoTDB 联合赋能智慧能源

Apache IoTDB 论文入选数据库国际顶会 ICDE 2024

IoTDB 集群高效管理小帮手：开机自启

就在这周末！CommunityOverCode Asia 2024 IoT 专题等你参会

【IoTDB 线上小课 05】时序数据文件 TsFile 三问“解密”！

IoTDB 分段查询语句详解：GROUP BY + 时序语义

时序数据库如何选型？详细指标总结！

IoTDB 集群高效管理：一键启停功能介绍

【活动预告】Apache IoTDB & TsFile 智慧能源应用“上会”啦！

IoTDB 社区出品｜CommunityOverCode Asia 2024 专题介绍之 IoT

IoTDB 征文活动评选结果新鲜出炉！

从开源小白到新晋 committer：主动尝试，心无旁骛，收获满满！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉