IoTDB 分段查询语句详解：GROUP BY + 时序语义

文摘 2024-07-19 17:48 中国香港

GROUP BY 查询子句的时序语义展开，IoTDB 支持的分段方式总结！

存储的数据通过分析来发挥价值，当一组被存储的数据通过查询得到分析后的结果时，这些数据才真正在数据库中实现了价值闭环。

在关系型数据库中，GROUP BY 子句是 SQL 语言中用于将结果集按照一个或多个列分组的关键字。它通常与聚合函数一起使用，如 COUNT(), SUM(), AVG(), MIN(), MAX() 等，以便对每个分组的数据进行统计或计算。但由于关系型数据库中的数值没有时间顺序的概念，所以在分组时并不会考虑分组键前后。

如下图所示：基于值列的分组通常以数据是否等值为分组条件，分段方式较为固定。

而时序场景下，比起分组键的列值组合，我们通常更加在意时间维度前后数据的联系。基于时间列分组，可能要求不同大小的滑动窗口等符合时序语义的分段方式。

因此 IoTDB 提供了针对基于时间列的新型分段场景，支持用户使用内置简单 SQL 语句快速便捷的对时序数据进行分段，更好的提取时序数据的相关特征，帮助用户更高效的在时序场景下发掘数据价值。

方法一：按时间区间分段

作为最基本的时间分段方式，IoTDB 可以支持基本的时间滑动窗口分段。可以指定聚合的时间间隔和滑动步长来定义窗口。其 SQL 主要包含三个参数：

[startTime, endTime): 查询的时间范围
interval: 单个分段窗口的大小

sliding step: 窗口的滑动步长

GROUP BY ([startTime, endTime), size, step)

下图展示了这三个参数的含义：

方法二：按数据差值分段

传统的分段方式可以对相同的值进行分段，在时序语义下，由于数据可以保证按时间顺序到来，我们可以将值的变化规律作为分段的依据。

在IoTDB的差值分段中，我们将第一条数据作为一个时间段的基准，每个分段会按照给定表达式与基准数值行进行差值运算，如果差值小于给定的阈值则加入当前时间段；如果超过给定阈值，则分为下一个时间段。

下图解释了该分段方式：

其 SQL 与不同的参数含义如下：

GROUP BY VARIATION(controlExpression[,delta][,ignoreNull=true/false])

controlExpression：分组所参照的值，可以是数据行中的某一列或是多列的表达式
delta：分组所使用的阈值，默认为 0

ignoreNull：用于指定 controlExpression 计算结果为 null 时对数据的处理方式，ignoreNull 为 true 时，则直接跳过对应的点，否则创建新的时间段。

方法三：按会话间隔分段

在实际场景，即使是有序的时间列，可能也并不连续。而这些时间列之间的时间间隔便可以作为分段的依据，会话分段可以将时间间隔超过一定阈值的数据切割为不同时间段。如下所示：

GROUP BY SESSION(timeInterval)

方法四：按数据点数分段

在一些场景中，我们会在时序语义下基于连续的时间点数做分段，将连续的指定数量数据点分为一组。如下所示：

GROUP BY COUNT(controlExpression,size[,ignoreNull=true/false])

方法五：按符合条件的数据点数分段

对于顺序到来的数据，我们还可以指定条件表达式来对数据行进行筛选。将符合条件的连续数据点加入时间段，如下图，将数值为 True 的数据点每三个分为一段，其分段示意图和 SQL 定义如下：

GROUP BY CONDITION(predictExpression[keep >/>=/=/<=/<]threshold[,ignoreNull=true/false])

predictExpression：返回值为 boolean 数据类型的表达式，用于数据行的筛选
keep：行数满足 keep 的表达式的数据行会被加入到时间段中

ignoreNull：predictExpression 为 null 时数据行的处理方式，为 true 跳过该行，否则创建新的时间段

总结

本文为大家详细介绍了当前 IoTDB 中具备时序特色语义的分段方式，不同于关系型数据库的传统关系代数（针对无序集合的算子），上述分段方式均利用了时序数据天然有序的语义，大家可以通过这些便捷的语法实现自身业务的查询需求。除了这些分段方式之外，IoTDB 本身提供了一个通用的分段框架，欢迎感兴趣的朋友参与 IoTDB 社区，贡献多样的分段实现。

规上企业应用实例

能源电力：中核武汉｜国网信通产业集团｜华润电力｜大唐先一｜上海电气国轩｜清安储能｜太极股份｜绍兴安瑞思

航天航空：中航机载共性｜北邮一号卫星

钢铁冶炼：宝武钢铁｜中冶赛迪

交通运输：中车四方｜长安汽车｜城建智控｜德国铁路

智慧工厂与物联：PCB 龙头企业｜博世力士乐｜德国宝马｜京东｜昆仑数据｜怡养科技

http://mp.weixin.qq.com/s?__biz=MzU4NjU4NTUxNA==&mid=2247498997&idx=1&sn=6749816a2677a62b1607dbb2a4faf5f7

Apache IoTDB

一款高吞吐、高压缩、高可用、支持存储、管理与分析的物联网原生开源时序数据库系统软件。

最新文章

【IoTDB 线上小课 09】时序大模型的发展历程，出现高性能国产成果？

Apache IoTDB v1.3.3 发布｜新增数据订阅，DataNode 主动监听并加载 TsFile 等功能

IoTDB 航空航天解决方案：从制造到试飞，助力国之重器翱翔长空

实现高效运行管理：如何使用 NSSM 工具将 IoTDB 注册为 Windows 系统服务

替换OpenTSDB和HBase，宝武集团使用IoTDB助力钢铁设备智能运维

IoTDB 与 HBase 对比详解：架构、功能与性能

时序数据库是什么：概念、特点与分类简析

【活动预告】Apache TsFile 干货总结在 COSCON'24 等你~！

IoTDB 探索季活动｜大疆无人机等你来拿

【IoTDB 线上小课 08】时序数据库融合 AI，带来的效果竟然是？

国际开发者成为 Apache IoTDB Committer，新视角谈开源经验！

如何评估和观测 IoTDB 所需的网络带宽？

节省60%资源，替换Cassandra，北京城建智控牵手IoTDB为地铁运行保驾护航

专业期刊《Java aktuell》：使用Apache TsFile和Apache IoTDB对时序数据进行分布式数据采集

IoTDB 论文入选三大数据库顶会：ICDE、SIGMOD、VLDB 收录自研成果！

【功能详解】IoTDB 与 ThingsBoard 成功集成！

【IoTDB 线上小课 07】多类写入接口，快速易懂的“说明书”！

VLDB 2024 圆桌会议回顾：展望物联网与 AI 时代的时序数据库

Apache IoTDB 毕业四周年快乐！龙年 T 恤别错过

阿里云AMD护航，天谋科技携IoTDB登顶TPCx-IoT国际权威榜单

邀请函 | Pulsar Meetup 北京 2024

IoTDB 端边云同步：SQL 一键搞定 5 大常见场景

时序数据库 IoTDB 为什么选择 TPCx-IoT 基准测评？

央视报道时序数据库 IoTDB 性能刷新世界记录！

源于清华的开源时序数据库IoTDB刷新世界纪录

IoTDB 在顶级会议 VLDB 2024：四篇最新论文入选，特邀做 TPC 报告与讨论会！

IoTDB 如何有效实现磁盘 I/O 监控和优化？

关于 IoTDB 的疑问，我们这次有奖征集！

【IoTDB 线上小课 06】列式写入=时序数据写入性能“利器”？

云上集成时序数据库 IoTDB，海量储能数据实现高效处理与实时分析

必看！时序大模型的发展、玩家与效果对比

一次性揭秘 IoTDB 端边云同步的 7 大特性！

创业过去1024天，我后悔了吗？

【活动预告】第四届西门子工业边缘生态大会，Apache IoTDB 来啦！

IoTDB 单机/双活/集群部署的区别和适用场景

【活动预告】研讨会+开源集市，IoTDB “登录” GOTC 2024！

IoTDB组件AI Node发布9个月，如何使用你了解了吗？

IoTDB 集群性能优化：内存配置详解

可信数据库发展大会回顾 | 天谋科技乔嘉林：Apache TsFile & IoTDB 联合赋能智慧能源

Apache IoTDB 论文入选数据库国际顶会 ICDE 2024

IoTDB 集群高效管理小帮手：开机自启

就在这周末！CommunityOverCode Asia 2024 IoT 专题等你参会

【IoTDB 线上小课 05】时序数据文件 TsFile 三问“解密”！

IoTDB 分段查询语句详解：GROUP BY + 时序语义

时序数据库如何选型？详细指标总结！

IoTDB 集群高效管理：一键启停功能介绍

【活动预告】Apache IoTDB & TsFile 智慧能源应用“上会”啦！

IoTDB 社区出品｜CommunityOverCode Asia 2024 专题介绍之 IoT

IoTDB 征文活动评选结果新鲜出炉！

从开源小白到新晋 committer：主动尝试，心无旁骛，收获满满！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉