时序数据库如何选型？详细指标总结！

文摘 2024-07-18 18:05 北京

工业物联网场景，如何判断什么才是好的时序数据库？

工业物联网将机器设备、控制系统与信息系统、业务过程连接起来，利用海量数据进行分析决策，是智能制造的基础设施，并影响整个工业价值链。工业物联网机器设备感知形成了海量时间序列数据（带时间标签的数据，每条时间序列是按时间戳顺序存贮的一组数据点），蕴含丰富的工业语义，是工业大数据的规模与价值主体。

为应对海量工业物联网数据管理，更好地实现工业数字化、智能化发展，专门管理时序数据的时序数据库产品应运而生。那么如果需要使用时序数据库，该如何衡量时序数据库的性能表现？好用的时序数据库，又该满足哪些条件？本文将梳理时序数据库的性能选型标准，供大家参考。

时序数据管理难点

时序数据库的选型标准，跟时序数据本身处理的难点是息息相关的。

（1）技术难点

工业生产涉及的设备数量庞大，常见的业务场景中包含数万到数百万个设备，而单设备的传感器数量也可能很多，每一个传感器上报对应的指标/测量值（比如温度、速度等等），最终上报时序数据的测点（也就是指标/测量值的数量）可能达到几十万、上百万，甚至亿级，还会随着业务扩展动态地继续增加。

同时，时序数据的采样频次可能很高，实际应用中可能达到毫秒级的上报。设备多、测点多、采样频次高，这就导致时序数据的体量是非常庞大的，存储的成本也就随之增加，而且因为业务的需要，经常需要实现历史数据长期的存储。

（2）行业需求

工业物联网业务背景也催生了与工业应用强相关的特性需求。测点层级管理成为工业领域使用时序数据库的功能需求之一。这意味着时序数据库需要能够处理从集团、厂站、系统、设备到传感器等不同层级的测点数据，并能够实现这些数据的有效组织和管理，让企业可以方便地对应到数据产生的不同层级。

此外，端边云数据协同也是时序数据库在工业应用中的关键需求。因为工业设备的部署状态与边缘计算的兴起，数据不再只是从设备端直接传输到集团云端，而是在厂站或省域的边缘节点进行初步处理和分析，再向云端进行同步。这种协同机制能够充分利用边端算力，节省云端带宽成本。因此，时序数据库需要确保数据在不同终端之间能够顺畅协同，从而实现更加智能和高效的工业管理。

基本要求：写入、压缩、查询、分析

了解了上述的时序数据管理难点，再结合时序数据库应用的主要业务场景，也就是针对工业大数据智能管理转型所衍生的状态监控、故障告警、数字画像等等，选型时需要注重的性能指标主要包括以下几项：

（1）写入吞吐

第一是写入吞吐，也就是单位时间内成功写入时序数据的量，这个值越大代表同样时间内能写入的数据量越大。体量庞大的时序数据，需要保障其能够全量写入时序数据库，不产生数据丢失，同时需要保障自带强时间属性的低频时序数据和高频时序数据的写入实时性。实际场景中，时序数据库的高通量写入性能需要达到百万或千万数据点/秒。

（2）压缩比

第二是压缩比，也就是原始数据量除以磁盘存储空间的值，这个值越大代表数据库的压缩性能越好。时序数据量庞大会很容易导致磁盘空间占用很高，而能够实现高压缩比的时序数据库，同样的数据量占用的空间、需要的存储成本也就越小。实际场景中，时序数据库的压缩比需要达到至少 20 倍以上，在企业对比数据存储成本时会更加有竞争力。

（3）查询耗时及分析能力

第三是查询耗时及分析能力，耗时越短、分析能力越强，也就代表着企业能够更快地获知所需的数据结果，并进行更多样的深度挖掘。实际应用中，对于最新值查询、聚合查询等业务常用场景，时序数据库的查询延迟需要控制在毫秒级。在保障海量数据处理低延迟的基础上，时序数据库还需要支持数据计算、查看数据走向、数据缺失修复等分析功能。

进阶要求：面向工业物联网进行优化

上述指标能够让时序数据库实现工业数据管理的基本需求，而面对工业物联网场景的需求特性，更好的时序数据库可以实现为工业物联网“量身定制”的适配架构及功能。

（1）测点建模

工业时序数据常常是按照类似“集团-省域-厂站-产线-设备-传感器”的层级彼此关联起来的，而因为数据量庞大、层级多，管理的时候存在天然的困难度。因此，在数据建模方面，时序数据库应该在保证存储规模的前提下，实现与工业场景中的层级相对应的数据结构，并能够做到以采集、应用等团队的不同视角，实现对数据结构按设备地点、分析应用的多面组织管理，以减少企业的学习、理解成本。

（2）数据同步

工业设备常常部署于多个省域的不同厂站，时序数据可能从多地同时产生，并需要汇总到省域侧或集团侧进行分析。因此，时序数据库需要适配多类主流协议，实现实时、易用、安全的数据同步方案，把设备端侧，厂站边侧，集团云侧的数据链路打通，方便企业更好地实现数据协同，也需要支持跨网闸传输、加密传输等工业场景所需要的特性传输方式，并保证在数据同步的过程中不影响本地的数据存储、计算。

（3）高可扩展

多终端、分散的工业设备上报时序数据的特性，也要求时序数据库能够以分布式的形态部署于多个厂站。面对多站点、更庞大的数据量，时序数据库需要保证集群容量的扩展性，能够管理上亿设备和测点，并具有高可用性，全面消除单点瓶颈，容忍部分节点失效，并能够随负载增加实现秒级扩容，及时分担负载压力。

（4）乱序写入、AI 分析

其实，对于上面提到的写入、分析等基础性能，也可以针对工业物联网场景进一步实现优化。比如，面对工业环境断网、延迟而产生的乱序数据，时序数据库需要能够有效应对，保障乱序数据写入的高实时性。再比如，面对工业故障监控、告警需求的进一步延伸，对于故障预测需求场景，时序数据库需要拥抱智能化分析，引入多类机器学习算法，以实现序列预测、异常预测等深度学习功能。

总结

针对不同工业领域和细分场景，时序数据库还可能有更多的关注重点，与更多技术融合的可能，上文总结的时序数据选型指标必将在未来进一步更新、扩展。

而国产自研的时序数据库 IoTDB，针对上面的选型指标都达到了稳定、高效的性能表现。IoTDB 的写入吞吐、存储占用、读取延迟等指标，在国际数据库第三方性能测试排行榜 benchANT 中，均位居第一，并在乱序数据写入、智能数据分析、数据协同传输、分布式扩展部署等工业物联网场景需求方向，都实现了相关功能的支持。

同时，IoTDB 商业化友好，具备便捷的二次开发能力，并已拥有一系列适配的易用性工具，包括集群管理工具 IoTDB-OpsKit、系统监控面板、可视化控制台 Workbench、组态软件等等，无疑能够更好地帮助数据库运维人员与业务人员发挥 IoTDB 的最大价值。

想要详细了解 IoTDB 的相关功能，欢迎点击阅读“时序数据库IoTDB：功能详解与行业应用”并联系我们！

http://mp.weixin.qq.com/s?__biz=MzU4NjU4NTUxNA==&mid=2247498966&idx=1&sn=b801d37a5afd95bf02c620b8899b86b9

Apache IoTDB

一款高吞吐、高压缩、高可用、支持存储、管理与分析的物联网原生开源时序数据库系统软件。

最新文章

【IoTDB 线上小课 09】时序大模型的发展历程，出现高性能国产成果？

Apache IoTDB v1.3.3 发布｜新增数据订阅，DataNode 主动监听并加载 TsFile 等功能

IoTDB 航空航天解决方案：从制造到试飞，助力国之重器翱翔长空

实现高效运行管理：如何使用 NSSM 工具将 IoTDB 注册为 Windows 系统服务

替换OpenTSDB和HBase，宝武集团使用IoTDB助力钢铁设备智能运维

IoTDB 与 HBase 对比详解：架构、功能与性能

时序数据库是什么：概念、特点与分类简析

【活动预告】Apache TsFile 干货总结在 COSCON'24 等你~！

IoTDB 探索季活动｜大疆无人机等你来拿

【IoTDB 线上小课 08】时序数据库融合 AI，带来的效果竟然是？

国际开发者成为 Apache IoTDB Committer，新视角谈开源经验！

如何评估和观测 IoTDB 所需的网络带宽？

节省60%资源，替换Cassandra，北京城建智控牵手IoTDB为地铁运行保驾护航

专业期刊《Java aktuell》：使用Apache TsFile和Apache IoTDB对时序数据进行分布式数据采集

IoTDB 论文入选三大数据库顶会：ICDE、SIGMOD、VLDB 收录自研成果！

【功能详解】IoTDB 与 ThingsBoard 成功集成！

【IoTDB 线上小课 07】多类写入接口，快速易懂的“说明书”！

VLDB 2024 圆桌会议回顾：展望物联网与 AI 时代的时序数据库

Apache IoTDB 毕业四周年快乐！龙年 T 恤别错过

阿里云AMD护航，天谋科技携IoTDB登顶TPCx-IoT国际权威榜单

邀请函 | Pulsar Meetup 北京 2024

IoTDB 端边云同步：SQL 一键搞定 5 大常见场景

时序数据库 IoTDB 为什么选择 TPCx-IoT 基准测评？

央视报道时序数据库 IoTDB 性能刷新世界记录！

源于清华的开源时序数据库IoTDB刷新世界纪录

IoTDB 在顶级会议 VLDB 2024：四篇最新论文入选，特邀做 TPC 报告与讨论会！

IoTDB 如何有效实现磁盘 I/O 监控和优化？

关于 IoTDB 的疑问，我们这次有奖征集！

【IoTDB 线上小课 06】列式写入=时序数据写入性能“利器”？

云上集成时序数据库 IoTDB，海量储能数据实现高效处理与实时分析

必看！时序大模型的发展、玩家与效果对比

一次性揭秘 IoTDB 端边云同步的 7 大特性！

创业过去1024天，我后悔了吗？

【活动预告】第四届西门子工业边缘生态大会，Apache IoTDB 来啦！

IoTDB 单机/双活/集群部署的区别和适用场景

【活动预告】研讨会+开源集市，IoTDB “登录” GOTC 2024！

IoTDB组件AI Node发布9个月，如何使用你了解了吗？

IoTDB 集群性能优化：内存配置详解

可信数据库发展大会回顾 | 天谋科技乔嘉林：Apache TsFile & IoTDB 联合赋能智慧能源

Apache IoTDB 论文入选数据库国际顶会 ICDE 2024

IoTDB 集群高效管理小帮手：开机自启

就在这周末！CommunityOverCode Asia 2024 IoT 专题等你参会

【IoTDB 线上小课 05】时序数据文件 TsFile 三问“解密”！

IoTDB 分段查询语句详解：GROUP BY + 时序语义

时序数据库如何选型？详细指标总结！

IoTDB 集群高效管理：一键启停功能介绍

【活动预告】Apache IoTDB & TsFile 智慧能源应用“上会”啦！

IoTDB 社区出品｜CommunityOverCode Asia 2024 专题介绍之 IoT

IoTDB 征文活动评选结果新鲜出炉！

从开源小白到新晋 committer：主动尝试，心无旁骛，收获满满！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉