openGauss的数据处理能力调优实践

文摘 2024-09-24 17:30 广东

前文

众所周知，openGauss是TP处理数据库，擅长交易、转帐、支付的业务场景，因为它是一个单机的数据库，没有分布式处理能力，大部分人认为它的分析处理能力会很弱。其实openGauss在存储引擎支持列式，支持并行查询，支询分区，支持向量化,所以它的查询处理能力也是不弱的。

测试环境

配置条件

CPU	内存	版本	数据量
i7	8G	openGauss6	66681536

测试SQL

#表结构CREATE TABLE LINEITEM_C ( L_ORDERKEY   INTEGER NOT NULL,L_PARTKEY  INTEGER NOT NULL, L_SUPPKEY   INTEGER NOT NULL, L_LINENUMBER  INTEGER NOT NULL,L_QUANTITY    DECIMAL(15,2) NOT NULL, L_EXTENDEDPRICE DECIMAL(15,2) NOT NULL, L_DISCOUNT     DECIMAL(15,2) NOT NULL, L_TAX   DECIMAL(15,2) NOT NULL, L_RETURNFLAG CHAR(1) NOT NULL, L_LINESTATUS CHAR(1) NOT NULL, L_SHIPDATE  DATE NOT NULL, L_COMMITDATE DATE NOT NULL, L_RECEIPTDATE DATE NOT NULL, L_SHIPINSTRUCT CHAR(25) NOT NULL, L_SHIPMODE  CHAR(10) NOT NULL, L_COMMENT  VARCHAR(44) NOT NULL) ;

#执行SQLEXPLAIN ANALYZE SELECTL_RETURNFLAG, L_LINESTATUS,SUM(L_QUANTITY) AS SUM_QTY, SUM(L_EXTENDEDPRICE) AS SUM_BASE_PRICE,SUM(L_EXTENDEDPRICE * (1 - L_DISCOUNT)) AS SUM_DISC_PRICE, SUM(L_EXTENDEDPRICE * (1 - L_DISCOUNT) * (1 + L_TAX)) AS SUM_CHARGE, AVG(L_QUANTITY) AS AVG_QTY,AVG(L_EXTENDEDPRICE) AS AVG_PRICE, AVG(L_DISCOUNT) AS AVG_DISC, COUNT(*) AS COUNT_ORDERFROM LINEITEM_COPY WHEREL_SHIPDATE = DATE '1994-01-16' GROUP BYL_RETURNFLAG, L_LINESTATUS;

测试方法

行式表是慢的，列式表是快的，有分区是好事，没有分区是坏事，openGauss支持往行式添加向量化技术。根据不同考虑一共有以下测试。

行式表带分区
向量化行式表加分区
行式表没有分区
向量化行式表没有分区
列式表有分区
列式表无分区
列式表有分区加上并行查询

测试SQL

行式表有分区

执行时间：730615.702ms

向量化行式表有分区

set try_vector_engine_strategy=force;

执行时间：119065.411ms

行式表没有分区

执行时间：419898.535ms

Lineitem_copy行式表，没有分区，没有排序

运行算子有seq scan，显性声明是全盘扫描，一共耗时419898.535ms

向量化行式表【无分区】

执行时间：85946.78ms

现在加上

set try_vector_engine_strategy=force;show try_vector_engine_strategy;

目标行式，基于表SQL查询耗时85946.78ms，对比原来的419898.535ms，有了很大效率的提升。底层观察对硬盘的利用率也提升了。

列式表【有分区】

执行时间：42247.220ms

有分区的列式表耗时42247.220ms，相对原来行式表向量化计算SQL查询85946.78ms，以及行式表没有分区的419898.535ms 性能大为提升

列式表【无分区】

执行时间：85872.221 ms

列式表【有分区】8个CPU

执行时间：12140.229ms

总结

行式表有分区	向量化行式表【有分区】	行式表没有分区	向量化行式表【无分区】	列式表【有分区】	列式表【无分区】	列式表【有分区】8个CPU
730615.702ms	119065.411ms	419898.535	85946.78ms	42247.220ms	85872.221ms	12140.229 ms

行式表有分区比行式表没有分区慢，重复看了几次，确定优化器在这里根据时间响应，它选择了顺序扫描，顺序扫描要比分区的要快，这里有可能是分区失效的问题，笔者没有深入。
行式表虽然不是列式的组织结构，但是可以调用向量化的技术进行处理，通过CPU的SIMD能力提高处理能力。
列式默认就带有向量化处理的能力，带分区的列式比没有分区的列式更友好。
CPU多核处理+ CPU的SIMD处理+分区+列式是目前来看是最好的。
优化没有终点，上述仅是实例参数的优化，SQL语句改造以及内存管理参数优化都是优化的手段。

点击阅读原文跳转作者文章

http://mp.weixin.qq.com/s?__biz=MzIyMDE3ODk1Nw==&mid=2247517889&idx=1&sn=12a5872b7ebe0675d2ae111449b20c7d

openGauss

开源关系型数据库

最新文章

快讯 | openGauss6.0.0 登陆RISC-V架构

openGauss6.0.0企业版使用普通用户搭建一主一备

数据库性能诊断工具DBdoctor快速纳管openGauss数据库

openGauss 内存管理

openGauss/POSTGRESQL 中float类型到int类型的隐式转换

openGauss 6.0.0 LTS 企业版：单机部署与配置实战

倒计时1天丨上海Meetup亮点速递，专家共论数智化转型，前沿技术与实践案例一站尽览

判断备机是否需要重建

addr2line解析openGauss日志

印美软件（上海）有限公司正式加入openGauss社区

openGauss6.0主备节点都为Primary分析处理

DataKit6.0将MySQL8.0迁移至openGauss6.0

深入体验openGauss 6.0 LTS：功能实战评测

2024 年度openGauss标杆应用实践案例征集工作正式启动

第八届openGauss技术文章征集活动 | 第二批初审合格名单公布！

openGauss智能化运维监控平台—DataKit

openGauss6.0企业版单中心一主一备切换

Centos7.6安装openGauss 6.0.0 (LTS)

使用dbops部署单中心opengauss6.0企业版（一主两从）

openGauss运维工具DataKit6.0部署

openGauss6.0单点企业版部署_openEuler22.03_x86

大道云行携手openGauss社区，共创智数时代先进存力

openGauss 6.0.0-LTS部署宝典：轻松掌握数据库部署的核心技巧

openGauss与pgpool-Ⅱ共建高可用方案的设想

openGauss6.0.0（LTS）企业版搭建主备集群保姆级部署手册

openGauss一种索引实现三种扫描方式：位图、索引和仅索引

openGauss社区8-10月季度汇报

第八届openGauss技术文章征集活动 | 首批初审合格名单公布！

跃昉科技正式加入openGauss社区，共同推动数据库技术创新与应用落地

openGauss 6.0.0-RC1 DataVec向量数据库测试

磐维数据库一体机发布开启国产数据库新征程，共创openGauss行业生态

四川众信互联科技有限公司正式加入openGauss社区

易库智能正式加入openGauss社区

【我和openGauss的故事】第八届openGauss技术文章征集活动

openGauss 6.0.0-RC1逻辑复制特性测试

统信服务器操作系统V20 1070e【openGauss 5.0.2 LTS 单节点扩容主备节点】

openGauss 6.0.0 LTS 版本正式发布!

海量数据出席华为全联接大会，再获殊荣

华为全联接大会丨以创新驱动变革，MogDB揭示关键行业数据库改造升级的高效路径

记录一次openGauss空间膨胀的故障排查

DBeaver连接openGauss报错Invalid username/password问题排查

一站式安装openGauss 6.0.0企业版

openGauss的数据处理能力调优实践

openGauss 6.0.0-RC1新特性：一站式交互安装初体验

统信服务器操作系统V20 1070e【openGauss 5.0.2 LTS 主备2节点部署】

观测openGauss的行组、页、数据类型三者的关系

openGauss 6.0.0新版本安装测评

DBeaver远程连接openGauss数据库报错汇总

Centos平台下openGauss 6.0.0-RC1企业版单机部署

CPU使用率异常增长？别慌，试试这个办法......

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

openGauss的数据处理能力调优实践

前文

测试环境

配置条件

测试SQL

测试方法

测试SQL

行式表有分区

向量化行式表有分区

行式表没有分区

向量化行式表 【无分区】

列式表 【有分区】

列式表 【无分区】

列式表 【有分区】8个CPU

总结

向量化行式表【无分区】

列式表【有分区】

列式表【无分区】

列式表【有分区】8个CPU