Oracle与GreatSQL差异：更改唯一索引列

文摘科技 2024-11-01 10:30 福建

* GreatSQL社区原创内容未经授权不得随意使用，转载请联系小编并注明来源。

1.问题来源

在从Oracle迁移到GreatSQL的应用系统中，一条普通的update语句在GreatSQL中却报错，需要进行SQL语句的改写。把实际问题简化为下面简单情况进行说明。

在Oracle下，可以正常执行的update语句。

-- 建表
CREATE TABLE test.test1 (
    id INT PRIMARY KEY,
    k INT NOT NULL,
    c CHAR(120) NOT NULL,
    pad CHAR(60) NOT NULL
);

-- 创建唯一索引
CREATE UNIQUE INDEX ui_test1_k ON test.test1 (k);

-- 插入数据
INSERT INTO test.test1 VALUES 
(1, 1, 'cc', 'pad'),
(2, 2, 'cc', 'pad'),
(3, 3, 'cc', 'pad'),
(4, 4, 'cc', 'pad');

-- 执行 UPDATE 语句
UPDATE test.test1 SET k = k + 1;
UPDATE test.test1 SET k = k - 1;

在GreatSQL下准备测试表和数据：

CREATE TABLE `test1` (
  `id` int NOT NULL AUTO_INCREMENT,
  `k` int NOT NULL DEFAULT '0',
  `c` char(120) COLLATE utf8mb4_bin NOT NULL DEFAULT '',
  `pad` char(60) COLLATE utf8mb4_bin NOT NULL DEFAULT '',
  PRIMARY KEY (`id`),
  UNIQUE KEY `ui_k` (`k`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;

greatsql> INSERT INTO test1 VALUES (1, 1, 'cc', 'pad');
greatsql> INSERT INTO test1 VALUES (2, 2, 'cc', 'pad');
greatsql> INSERT INTO test1 VALUES (3, 3, 'cc', 'pad');
greatsql> INSERT INTO test1 VALUES (4, 4, 'cc', 'pad');

同样的update语句，在GreatSQL下执行报错：

greatsql> UPDATE test1 SET k = k + 1;
ERROR 1062 (23000): Duplicate entry '2' for key 'test1.ui_k'

在GreatSQL下，UPDATE语句为什么报错呢？使用什么方法可以高效执行呢？

2.解决方法

由UPDATE语句的报错可知是唯一键重复的问题，将k=1的行更改k=k+1=2，与k=2的行重复。解决方法有2个方向：

让唯一索引暂时失效，update完成后再启用
让数据按一定的顺序执行，避免数据重复

尝试设置 unique_checks为0

设置会话系统变量unique_checks=0，则允许存储引擎假定输入数据中不存在重复的键。如果您确定您的数据不包含唯一性冲突，那么您可以将它设置为0，以加快将大型表导入InnoDB的速度。将此变量设置为0并不要求存储引擎忽略重复的键。仍然允许引擎检查它们，并且如果它检测到它们，就发出重复索引的错误。

实际测试，设置UNIQUE_CHECKS=0，update语句仍然报错。

greatsql> SET UNIQUE_CHECKS=0;
Query OK, 0 rows affected (0.00 sec)

greatsql> UPDATE test1 SET k = k + 1;
ERROR 1062 (23000): Duplicate entry '2' for key 'test1.ui_k'

方法1：删除唯一索引，update后重建

删除唯一索引，update后重建唯一索引的方法，有2个DDL操作，由于DDL前会自动提交事务，这种处理方法不能和其他操作在同一个事务中，同时也存在update后（有重复值）无法创建唯一索引的风险。适合数据的手工一次性处理。

greatsql> ALTER TABLE test1 DROP index kc;
Query OK, 0 rows affected (0.01 sec)
Records: 0  Duplicates: 0  Warnings: 0

greatsql> UPDATE test1 SET k=k+1 ;
Query OK, 100 rows affected (0.01 sec)
Rows matched: 100  Changed: 100  Warnings: 0

greatesql> ALTER TABLE test1 ADD UNIQUE key ui_k(k);
Query OK, 0 rows affected (0.09 sec)
Records: 0  Duplicates: 0  Warnings: 0

方法2：update按顺序执行

可以在update语句中使用order by子句，按照k值顺序执行，避免update后的数据与原有数据重复。

#k=k+1时，需要按照降序执行
greatsql> UPDATE test1 SET k=k+1 ORDER BY k DESC; 
Query OK, 4 rows affected (0.01 sec)
Rows matched: 4  Changed: 4  Warnings: 0

greatsql> UPDATE test1 SET k=k+1 ORDER BY k ; 
ERROR 1062 (23000): Duplicate entry '2' for key 'test1.ui_k'

#k=k-1时，需要按照升序执行
greatsql> UPDATE test1 SET=k-1 ORDER BY k ;
Query OK, 4 rows affected (0.01 sec)
Rows matched: 4  Changed: 4  Warnings: 0

greatsql> UPDATE test1 SET k=k-1 ORDER BY k DESC; 
ERROR 1062 (23000): Duplicate entry '4' for key 'test1.ui_k'

执行效率对比

对比方法1和方法2的执行效率。

#方法1：删除唯一索引，UPDATE后重建
greatsql> ALTER TABLE test1 DROP index k;
Query OK, 0 rows affected (0.17 sec)
Records: 0  Duplicates: 0  Warnings: 0

greatsql> UPDATE test1 SET k=K+1;
Query OK, 1000000 rows affected (35.08 sec)
Rows matched: 1000000  Changed: 1000000  Warnings: 0

greatsql> ALTER TABLE test1 ADD UNIQUE index kc(k,c);
Query OK, 0 rows affected (12.35 sec)
Records: 0  Duplicates: 0  Warnings: 0

#方法2：UPDATE按顺序执行
greatsql> UPDATE test1 set k=K+1 ORDER BY k DESC;
Query OK, 1000000 rows affected (1 min 36.81 sec)
Rows matched: 1000000  Changed: 1000000  Warnings: 0

总结：执行时间方法1:方法2=47.50 : 96.81 = 1 : 2.04 ，方法1（删除唯一索引，update后重建）比方法2（update按顺序执行）执行行效率高1倍。

3.GreatSQL源码分析

通过对GreatSQL源码的分析，了解到上面update语句从server层调用InnoDB存储引擎层函数的调用关系如下，每update 1行数据调用ha_update_row()一次，每update 1行数据后都要检查唯一索引是否发生冲突。

#server层
Sql_cmd_update::update_single_table()
->ha_update_row() //更新一行数据                                                                             
    #innodb 存储引擎层
    -> ha_innobase::update_row() //更新innodb一行数据
        -> row_update_for_GreatSQL() //修改或删除数据
            -> row_update_for_GreatSQL_using_upd_graph() //更新行
                ->row_upd_step()  //更新行    
                    ->row_upd()  //更新索引
                        ->row_upd_sec_step()  //更新索引
                            ->row_ins_sec_index_entry()  //向索引中插入记录
                                ->row_ins_sec_index_entry_low()  //向索引中插入记录
                                    ->row_ins_scan_sec_index_for_duplicate()  //检查索引重复值
                                        ->row_ins_dupl_error_with_rec() //检查唯一索引冲突

handler::ha_update_row 函数的主要功能是更新表中的一行数据，并记录该操作到二进制日志中。
ha_innobase::update_row函数的主要功能是更新InnoDB表中的一行数据。
row_update_for_GreatSQL 修改或删除数据行。
row_update_for_GreatSQL_using_upd_graph 函数的主要功能是处理 GreatSQL 的行更新操作。
row_upd_step 函数的主要功能是处理行更新操作。
row_upd函数是更改数据行影响的索引。
row_upd_sec_step函数是根据记录行的更改或删除，更改二级索引或删除二级索引。
row_ins_sec_index_entry 函数的主要功能是向二级索引中插入一条记录。
row_ins_sec_index_entry_low 函数的主要功能是向二级索引中插入一个索引项。它首先进行一些初始化和检查，然后根据索引类型（空间索引或普通索引）进行搜索。在搜索过程中，它会检查唯一性约束，并根据需要执行插入或修改操作。
row_ins_scan_sec_index_for_duplicate函数的主要功能是扫描非聚集唯一索引，以检查是否存在与要插入的索引条目重复的记录。
row_ins_dupl_error_with_rec 函数的主要功能是检查在插入索引条目时是否会发生唯一键冲突。它通过比较要插入的条目和现有记录的字段来确定是否存在重复。

4.总结

在更改唯一索引列时，Oracle是完成SQL语句全部数据的更改后，再检查唯一索引的冲突；GreatSQL则是在SQL语句更改每1条数据后，在更新索引数据检查唯一索引的冲突。在应用系统从Oracle迁移到GreatSQL时，需注意予以改写。

5.延伸阅读

UPDATE 时主键冲突引发的思考(https://imysql.com/2008_06_17_sth_about_update_duplicate_key)

Enjoy GreatSQL :)

<往期推荐>

如何限制用户修改long_query_time

工具分享丨数据闪回工具 MyFlash

MariaDB 和 GreatSQL 性能差异背后的真相

展会 | 斩获殊荣！GreatSQL亮相2024 OSCAR开源产业大会彰显开源实力

GreatSQL 在SQL中使用 HINT 语法修改会话变量

《GreatSQL运维实战》视频课程

<关于 GreatSQL>

GreatSQL数据库是一款开源免费数据库，可在普通硬件上满足金融级应用场景，具有高可用、高性能、高兼容、高安全等特性，可作为MySQL或Percona Server for MySQL的理想可选替换。

💻社区官网: https://greatsql.cn/

⏩Gitee : https://gitee.com/GreatSQL/GreatSQL
⏩GitHub : https://github.com/GreatSQL/

🆙BiliBili : https://space.bilibili.com/1363850082

（对文章有疑问或见解可去社区官网提出哦~）

加入微信交流群	加入QQ交流群

想看更多技术好文，点个"在看"吧！

http://mp.weixin.qq.com/s?__biz=MzkzMTIzMDgwMg==&mid=2247509278&idx=1&sn=12fd7cd384781e1b7be314e8b8053a70

GreatSQL社区

专注GreatSQL数据库及相关产品

最新文章

【GreatSQL优化器-02】索引和Sargable谓词

5.7 与 8.0 对相同文件的 LOAD DATA 语句结果不同

GreatSQL社区月报 | 2024.10

【GreatSQL优化器-01】const_table

MySQL 8.0 执行COUNT()很慢原因分析

Oracle与GreatSQL差异：更改唯一索引列

如何限制用户修改long_query_time

工具分享丨数据闪回工具 MyFlash

MariaDB 和 GreatSQL 性能差异背后的真相

展会 | 斩获殊荣！GreatSQL亮相2024 OSCAR开源产业大会彰显开源实力

GreatSQL 在SQL中使用 HINT 语法修改会话变量

某市驾驶培训监管服务平台 GreatSQL 数据库适配之旅

误删 GreatSQL 数据？别慌，Binlog来帮忙

下周三见！与GreatSQL一起相约OSCAR 开源产业大会

GreatSQL社区月报 | 2024.09

通过 MySQL Workbench 将 SQL Server 迁移到 GreatSQL

2024开放原子开源生态大会 | 万里数据库+GreatSQL齐亮相锚定开源探索新技术升级

使用 MySQLslap 对 GreatSQL 压力测试步骤

GreatSQL 中为什么 Update 不会被锁等待

诚邀莅临丨赋能开源生态建设 GreatSQL邀您参加2024开放原子开源生态大会

Percona Toolkit 神器全攻略（性能类）

GreatSQL 异步复制及搭建

Percona Toolkit 神器全攻略（复制类）

GreatSQL执行Update失败案例分析

GreatSQL社区月报 | 2024.08

Percona Toolkit 神器全攻略（开发类）

独家揭秘丨GreatSQL 的MDL锁策略升级对执行的影响

单条记录大小增长倍数和ibd文件大小的增长倍数不成正比

GreatSQL社区月报 | 2024.07

GreatSQL 并行Load Data加快数据导入

Percona Toolkit 神器全攻略（系统类）

MySQL UDF 提权初探

活动 | GreatSQL受邀ACMUG技术沙龙北京站分享AP探索之路

GreatSQL 8.0.32-26 GA（2024.8.5）

活动预告 | GreatSQL 邀你参加 ACMUG 技术分享北京站

GreatSQL 的刷新锁

GreatSQL 构建高效 HTAP 服务架构指南（MGR）

独家揭秘丨GreatSQL 没开Binlog时多线程插入数据性能劣化之谜

GreatSQL 构建高效 HTAP 服务架构指南（主从复制）

GreatSQL社区月报 | 2024.06

FILE+POS 方式 GreatSQL 主从复制架构给主节点磁盘扩容

展会 | GreatSQL亮相全球数字经济大会开源数据库赋能金融数字化转型

GreatSQL 中 Insert 慢是什么情况？

Percona Toolkit 神器全攻略（监控类）

官答丨操作系统升级 Openssl 导致 GreatSQL 无法启动

Percona Toolkit 神器全攻略（配置类）

GreatSQL HTAP探索之路

GreatSQL社区月报 | 2024.05

MySQL5.7 通过逻辑备份迁移到GreatSQL注意事项

Percona Toolkit 神器全攻略（实用类）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉