从KingbaseES V9的自研优化器算子谈起

文摘 2024-10-15 08:03 北京

9月30号发布的第二批数据库国测结果中，电科金仓通过了两款数据库，算上第一批通过的KingbaseES V8（以下简称KES），电科金仓目前有3款数据库在国测清单中。本次国测结果对于数据库厂商来说是生死攸关的，因为大规模数据库国产化替代工作马上就要展开，这会让通过国测的企业在市场上肯定会拥有一定的优势。

KES V8/V9两个版本都过了国测，这让电科金仓的新老用户在国产化替代工作中省了不少力气。V8老用户不必急着升级，新用户可以大胆地选择功能和性能更加优秀的V9版本。之前我听一些同学吐槽过，说因为PG内核升级了，所以KES V9的性能就比V8好了。事实是这样吗？有些东西道听途说总是不太靠谱，还是眼见为实才好。

上面的信息是D-SMART从KES V8R6中采集出来的，可以看出服务器版本是12.1。

上面是V9的信息，服务器版本并未升级。看样子V9在某些SQL上的性能提升并不是如坊间传闻的那样，是因为使用了较新版本的内核。通过对KES V9的初步分析，我个人的推测是，电科金仓在KES数据库内核可能上已经走上了自主分支的道路，不一定会紧跟PG社区内核升级了。在核心上脱离社区，构建自主的独立分支，同时关注社区的技术发展，不断把社区版本中的优秀方案搬到自主内核上。既保证了对用户需求的更好支撑，又可以不断吸取社区的先进思想，从而确保技术演进高效的前提下成本最低，这对于目前研发资金不太足够的国产数据库来说至关重要。

目前国产化替代中，用户遇到的最主要问题有两方面，一方面是如何在最小改动的情况下将企业中原来在国外商用数据库上跑得很好的应用迁移到国产数据库上，这方面很多国产数据库做得都不错。比如达梦、电科金仓、神通这些老牌数据库厂商，经过十多年的技术积累，在Oracle、MySQL、PG、DB2、SQL SERVER等数据库的兼容性上做得都相当不错了。另外一方面是迁移过来的应用性能不能太差，起码能够接近原有数据库的水平或者相差不是太大。

第二方面的问题也是目前大多数国产数据库在用户现场遇到最多的，就是一些SQL的执行计划不如Oracle优秀，导致系统迁移后应用性能无法被用户接受。其中很重要的原因是因为国产数据库的优化器功能不足，某些Oracle支持的执行算子自身不支持。要解决这些问题，就需要数据库厂商在内核上多下点功夫，提升优化器的能力。

还有一种情况是某些用户的SQL写法并不常规，数据库产品经理没有想到会有这样的SQL存在，所以在生成执行计划时rewrite出来的等价SQL不够合理，从而导致随后生成的执行计划性能不佳。这类问题往往是因为我们的国产数据库实战的应用场景还不够丰富，因此没有发现这类问题。如果这类问题能够被发现的话，作为具有一定自主核心研发能力的数据库厂商可以很快就解决掉这些问题。

最近研究KES V9，发现内核中优化器方面的功能提升还是挺明显的，特别是自研算子和SQL REWRITE规则的丰富程度方面。举个例子，在PG数据库上遇到NOT IN子查询的语句还是挺头疼的，PG在大多数情况下会使用FILTER算子。我们来看下面的测试用例：

DROP TABLE JOIN1;

DROP TABLE JOIN2;

create table join1 (id integer,name varchar(300),k1 integer);

create table join2 (id integer,name varchar(300),score integer);

insert into join1 values ( generate_series(1,20000),'aaaaaaaaaaaaaaaaAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',10);

insert into join1 values ( generate_series(50201,50300),'aaaaaaaaaaaaaaaaAAAAAAAAAAAAAAAAAAAAAASSSSSAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',10);

insert into join1 values ( generate_series(150201,1350300),'aaaaaaaaaaaaaaaaAAAAAAAAAAAAAAAAAAAAAASSSSSAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',10);

insert into join2 values ( generate_series(1,40000),'aaaaaaaaaaaaaaaaAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',1);

insert into join2 values ( generate_series(1,40000),'aaaaaaaaaaaaaaaaAAAAAAABBAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',2);

insert into join2 values ( generate_series(20001,22000),'aaaaaaaaaaaaaaaaAACCCCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',3);

insert into join2 values ( generate_series(150201,950300),'aaaaaaaaaaaaaaaaAACCCCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaaAAAAAAAAAAAAAAAAAAAAaaaaaaaAAAAAAAAAAAAAAAAAAAAA',3);

create index idx_j1 on join1(id);

create index idx_j2 on join2(id);

VACUUM ANALYZE JOIN1;

VACUUM ANALYZE JOIN2;

首先我们在一套PG 14上测试一下下面的一个带有NOT IN子查询的SQL：

这是PG典型的过滤器算子。子查询扫描出来的数据做HASH，然后对外表的每行计算HASH值，进行否定过滤。这种执行计划与HASH ANTI JION相比存在一定的缺陷，无法更好选择左表，而且当子计划返回的数据超过WORK_MEM限制的时候，无法使用HASH表，会极大影响SQL的执行效率。以前在优化PG数据库上的应用时，遇到此类情况，只能改写SQL了。

我们再来看一下KES V9，它使用了Hash Anti LSNA Jion算子，效率也高了不少。Oracle、SQL SERVER等数据库都支持Hash Anti Jion算子，这对于NOT IN等类型的SQL消除子查询是十分有效的，特别对于数据量很大的情况。KES在算子方面从O记借鉴了很多，对于HASH ANTI JOIN，设计了NA ，LSNA，RSNA等多种算子，分别针对不同的场景。

上面的例子中，PG数据库做Filter的subplan返回的数据集还不算很大，我们设置32M的WORK_MEM还能够放得下整个HASH表，PG可以采用Hash算法来做Filter，此时的性能与HASH ANTI JOIN差别还不算大。如果返回的数据集比较大，PG的执行计划就会恶化。通过一个简单的测试，把T2的数据加大，再做一次测试看看。

上面是KES V9的执行计划，可以看出KES依然使用了Hash Anti Jion，因为我去掉了子查询中的>条件，返回的结果集可能带有空值，所以无法使用更加高效的LSNA算子，使用了NA算子。从响应时间上看是可以接受的，644毫秒相对数据量的增长还算线性。接下来再来看看PG 14的执行情况。

因为WORK_MEM不足，因此按照PG优化器的限制无法使用HASH，改为使用Materialize，所以这条SQL的执行时间恶化到75146毫秒。

当然我们也可以通过设置更大的WORK_MEM来优化这条SQL，上面是我们把WORK_MEM加大到64M后的执行效果。不过能够在不需要调整WORK_MEM的情况下，通过优化器去解决这些问题，是不是对用户更加友好呢？而实际生产环境中，很多情况下，子查询的结果集可能会更大，我们也不能总是通过加大WORK_MEM来解决问题吧。

对于此类查询，Hash Anti Jion算子并不一定是最优的选择，如果子查询能够等价转换为JOIN，那么在不同的情况下，可能需要使用其他的算子来解决问题。修改一下查询条件，让外表扫描返回的数据量更少，在这个案例里KES V9优化器认为走Nested Loop Anti Jion最佳，看上图的结果，确实如此，执行时间降低到50毫秒。除此之外，适当调整数据量，我们还能看到这条SQL使用了MERGE ANTI JOIN算子，这些算子都是KES为了提升此类表连接的性能自研的。

PG 14则还是使用祖传的Filter: (NOT (hashed SubPlan 1))算子，执行时间的差距拉得更大了。

实际上目前数据库国产化替代工作中遇到的最麻烦的事情就是替换后很多执行计划变差，而且无法优化，只能通过修改SQL来解决问题，这给数据库国产化替代工作带来了额外的成本。

KES V9版本里，多了很多面向用户应用场景的优化器功能增强，比如参数kdb_rbo.enable_push_joininfo_to_union可以控制优化器的行为，让一个带有UNION操作的子查询参与连接操作，该特性可以将连接的条件下推到UNION连接的各子查询中，从而优化nested loop算子，从而提高SQL的性能。

另外一个例子是针对大表做count distinct这个算子的优化，在数据重复度比较高的情况下，KES通过等价变换逻辑变换，将select count(distinct name) from t1; 转换成select count(name) from (select name from t1 group by name);的形式，可以大大提高SQL的效率。当然这种优化和数据的分布关系很大，因此并不是通用性的，通过调整kdb_rbo.attribute_distinct_value_threshold参数，用户可以根据自己应用的数据分布特点，在普通情况下使用传统的方式去处理，而达到参数规定的阈值后，自动启用SQL改写，从而能够更加灵活地解决SQL的性能问题。

其实DB2、Oracle的优化器中就有大量的这样的开关，这些开关，都是不断地在解决用户的实际问题的时候不断积累出来的。听电科金仓的同学说，目前他们正针对数百个客户现场遇到的与执行计划相关的性能问题，设计了大量的优化补丁，正在一个一个地投入研发解决。这些针对优化器的PATCH将会在未来的V9版本中陆续发布。

对于电科金仓的用户来说，这是个福音，这比简单地通过升级数据库内核获得某些方面的性能和功能的提升有价值得多。其实企业应用系统所需要的数据库功能与并发处理能力，目前的绝大多数数据库都已经够用了。用户最急迫需要的是无论自己的应用写得多烂，数据库厂商都能够通过对优化器的改进让用户的应用能够跑起来。在这方面，电科金仓的KES做得确实不错。

供稿：“白鳝的洞穴”微信公众号

编辑：木子

审核：日尧

http://mp.weixin.qq.com/s?__biz=MjM5NjgwMDMxMg==&mid=2652201802&idx=1&sn=9fc557cd65782387c51e069e3bd7acf7

金仓数据库

电科金仓成立于1999年，系中国电子科技集团有限公司成员企业。电科金仓传承中国人民大学在数据库领域40余年技术积淀，企业级数据库产品KES广泛应用于金融、电信、能源、医疗、交通等行业的核心系统，致力于成为世界卓越的数据库产品与服务提供商。

最新文章

以“数”赋能！电科金仓出席2024年南湖HIT论坛

重生之我在金仓开发数据库：KES性能飞跃的秘密

邀请函 | 金仓数据库邀您共聚2024地理信息技术创新大会

在“浙”里，碰撞医疗信创的智慧火花

喜讯！电科金仓获评2024年软件和信息技术服务“优秀企业”

KING大咖直播 | 柔性迁移&双轨并行解决方案

2024全球创见者大会 | 电科金仓与金蝶达成战略合作签约

在中国搞数据库，活下来的都是奇迹！

1024，程序员节快乐！

校招｜电科金仓2025校园招聘火热进行中~

金陵论道！KING大咖面对面技术沙龙（南京站）成功举办

双一流大学“一网通办”系统的国产数据库实践

金仓数据库×武汉人社：共塑大数据应用智慧平台

每天76亿条！金仓数据库赋能运营商接入网智能化管理

从KingbaseES V9的自研优化器算子谈起

KING大咖直播 | KingbaseES国密身份认证详解

“移”路同行！金仓数据库亮相2024中国移动全球合作伙伴大会

电科金仓与天津理工大学计算机科学与工程学院项目启动会暨共建揭牌仪式圆满举行

数据60秒 | K宝邀你一同开启数据库王国的探险之旅

相聚金陵 | King大咖面对面沙龙报名开始啦~

2024中国移动全球合作伙伴大会与你携手共创AI+时代

双入围！金仓数据库集中式与分布式产品通过《安全可靠测评》

问道智算！金仓数据库参加2024 AI生态建设及开发者论坛

金仓数据库荣获新型电力系统数字技术卓越案例奖

核心！金仓数据库助力河南国际贸易“单一窗口”开启3.0时代

金仓数据库亮相2024年国际信息通信展览会

金仓数据库荣获申威产业发展联盟“年度优秀软件产品”奖

KING大咖直播 | 金仓数据库全负载系统测试方案

“医”路同行！金仓数据库亮相2024年粤闽医院信息网络大会

@所有人金仓数据库诚邀您相聚中国国际信息通信展览会

智焕新生共创AI+时代丨2024中国移动全球合作伙伴大会即将开启

核心！金仓数据库护航60万新生入学“无忧”

中秋喜乐，“月”来“月”好！（文末有彩蛋）

金仓数据库在“一带一路”高峰论坛引关注

KING大咖直播 | 金仓数据库迁移实战演练

金仓数据库LOGO焕新！

金仓数据库在“一带一路”上作好“工笔画”

KING大咖直播 | KingbaseES全面兼容SQLServer之重装上阵

核心！金仓数据库助力打造数字人社“佛山范本”

媒体报道｜“焕”新而来，金仓数据库初心不改领跑行业

香港见！金仓数据库邀您相聚第九届“一带一路”高峰论坛

号外！新手10分钟搞定应用，不信来试~

巅峰论剑！电科金仓出席国际顶级会议VLDB 2024

电科金仓闪耀2024数博会，引领数智新未来

重磅 | 人大金仓更名公告

探案录 | 备份空间不够用？金仓数据库破局！

面向未来十年，人大金仓准备这样干！

“黔”来相约！2024中国国际大数据产业博览会

KCM考证经验分享 | 高效学习秘籍，助您一路通关

数据库领域国际顶级会议VLDB邀您参加！坐标广州

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉