单条记录大小增长倍数和ibd文件大小的增长倍数不成正比

文摘科技 2024-08-16 08:01 福建

* GreatSQL社区原创内容未经授权不得随意使用，转载请联系小编并注明来源。

环境信息

数据库版本: GreatSQL 8.0.25

字符集：utf8mb4

innodb_default_row_format: dynamic

innodb_page_size: 16384

问题描述

表数据为新insert数据，无delete、无update

GreatSQL 一个数据量为1万的A表，有100个varchar字段，每个字段存10字节，ibd大小为21M

GreatSQL 一个数据量为1万的B表，有100个varchar字段，每个字段存100字节，ibd大小为4.7G

问题：相同数据量，相同数据量，B表的每行比A表大10倍，磁盘使用大小不是10倍，而是200多倍？

greatsql> show create table t_user_100_1000_100  \G;
*************************** 1. row ***************************
       Table: t_user_100_1000_100
Create Table: CREATE TABLE `t_user_100_1000_100` (
  `id` int NOT NULL AUTO_INCREMENT,
  `c_name1` varchar(10) NOT NULL DEFAULT '',
。。。
  `c_name100` varchar(10) NOT NULL DEFAULT '',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10001 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
1 row in set (0.00 sec)

greatsql> show create table t_user_100_10000_100  \G;
*************************** 1. row ***************************
       Table: t_user_100_10000_100
Create Table: CREATE TABLE `t_user_100_10000_100` (
  `id` int NOT NULL AUTO_INCREMENT,
  `c_name1` varchar(100) NOT NULL DEFAULT '',
。。。
  `c_name100` varchar(100) NOT NULL DEFAULT '',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=10001 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
1 row in set (0.00 sec)

greatsql> select count() from t_user_100_10000_100 ;
+----------+
| count() |
+----------+
| 10000 |
+----------+
1 row in set (0.06 sec)

greatsql> select count() from t_user_100_1000_100 ;
+----------+
| count() |
+----------+
| 10000 |
+----------+
1 row in set (0.18 sec)

#os ibd 文件大小
ll
total 4313096
-rw-r----- 1 mysql mysql 5016387584 Apr 9 18:52 t_user_100_10000_100.ibd
-rw-r----- 1 mysql mysql 20971520 Apr 9 18:40 t_user_100_1000_100.ibd

greatsql> select 5016387584/20971520 from dual;
+---------------------+
| 5016387584/20971520 |
+---------------------+
| 239.2000 |
+---------------------+
1 row in set (0.00 sec)

问题分析

多出来的24倍难道是碎片导致的？

使用optimize table重整表后，几乎没有任何优化，查看系统视图，也没有多少空洞。

使用官方工具innochecksum查看表空间文件PAGE类型分布，可以看到，B表相对A表多了大量的Other type of page。看来主要的空间消耗是在这个“Other”上。

INNODB的行溢出

INNODB默认下每个PAGE的大小为16K。B表每行10K，每个PAGE只能存放1行记录，余下的6K就浪费了。但即使按照这个算法，也只浪费了37%的空间。

实际上，INNODB在这里有个处理，当记录过大，会将最大的列使用一个指针替代，指针指向一个新的PAGE，在该PAGE上存放实际数据。

由函数page_zip_rec_needs_ext()判断是否需要溢出。判断方式是该记录长度是否大于空PAGE的可用空间。

GDB执行一下，可以看到一个16k的PAGE实际可用的空间为16252字节（页头等占用了小量字节）。一半粗略算作是8k。

如果行长度大于8K，会将最长的列存放到新的PAGE，原位置使用20字节的指针代替。如果处理后，行长度依然大于8K，则选择当前最长的列进一步处理，不断循环。如果列长度无法进一步缩少，仍然大于8K，则抛出DB_TOO_BIG_RECORD错误，即“row size too large”。dtuple_convert_big_rec()函数上可以看到更多的执行细节。

小量数据溢出的情况

以下堆栈展示把溢出数据写入"Off Page"。主要函数为lob::insert()。

log::insert()会申请一个新的16K大小的PAGE，并将数据写入新的page。

dberr_t insert(){
  ......
  //分配一个新的16KB的PAGE
  first_page_t first(mtr, index);
  buf_block_t *first_block = first.alloc(mtr, ctx->is_bulk());
  ......
  //将100字节写入写入
  ulint to_write = first.write(trxid, ptr, len);
  ......
 }

以下是B表插入数据，往innodb"Off page"写入数据时候的断点，可以看到只写了B表单列100字节数据。16KB的容量只写100字节的数据，剩余99%的空间用不上，实在太浪费了。

B表有100个varchar列，每个列100字节。如果需要满足列长少于8K，需要25个列以上进行溢出（一个列还有隐藏列和其它数据，实际需要溢出的列略多于25）。使用innochecksum查询到“OTHER” page 有29万，B表有一万行，平均每行29个“OTHER” page。看来这个“OTHER” page基本都是这种“Off page”了。

问题总结

GreatSQL 白白浪费了95%的磁盘空间，是因为大量的列溢出了小量的数据。INNODB存放每个溢出列的数据的最小分配单元大小是16KB。原本10KB的行长度，需要多占N倍的存储空间。

优化建议

表设计时，要注意控制行长度小于8k，避免小量列数据溢出，导致磁盘容量和性能问题。

最新文章

【GreatSQL优化器-02】索引和Sargable谓词

5.7 与 8.0 对相同文件的 LOAD DATA 语句结果不同

GreatSQL社区月报 | 2024.10

【GreatSQL优化器-01】const_table

MySQL 8.0 执行COUNT()很慢原因分析

Oracle与GreatSQL差异：更改唯一索引列

如何限制用户修改long_query_time

工具分享丨数据闪回工具 MyFlash

MariaDB 和 GreatSQL 性能差异背后的真相

展会 | 斩获殊荣！GreatSQL亮相2024 OSCAR开源产业大会彰显开源实力

GreatSQL 在SQL中使用 HINT 语法修改会话变量

某市驾驶培训监管服务平台 GreatSQL 数据库适配之旅

误删 GreatSQL 数据？别慌，Binlog来帮忙

下周三见！与GreatSQL一起相约OSCAR 开源产业大会

GreatSQL社区月报 | 2024.09

通过 MySQL Workbench 将 SQL Server 迁移到 GreatSQL

2024开放原子开源生态大会 | 万里数据库+GreatSQL齐亮相锚定开源探索新技术升级

使用 MySQLslap 对 GreatSQL 压力测试步骤

GreatSQL 中为什么 Update 不会被锁等待

诚邀莅临丨赋能开源生态建设 GreatSQL邀您参加2024开放原子开源生态大会

Percona Toolkit 神器全攻略（性能类）

GreatSQL 异步复制及搭建

Percona Toolkit 神器全攻略（复制类）

GreatSQL执行Update失败案例分析

GreatSQL社区月报 | 2024.08

Percona Toolkit 神器全攻略（开发类）

独家揭秘丨GreatSQL 的MDL锁策略升级对执行的影响

单条记录大小增长倍数和ibd文件大小的增长倍数不成正比

GreatSQL社区月报 | 2024.07

GreatSQL 并行Load Data加快数据导入

Percona Toolkit 神器全攻略（系统类）

MySQL UDF 提权初探

活动 | GreatSQL受邀ACMUG技术沙龙北京站分享AP探索之路

GreatSQL 8.0.32-26 GA（2024.8.5）

活动预告 | GreatSQL 邀你参加 ACMUG 技术分享北京站

GreatSQL 的刷新锁

GreatSQL 构建高效 HTAP 服务架构指南（MGR）

独家揭秘丨GreatSQL 没开Binlog时多线程插入数据性能劣化之谜

GreatSQL 构建高效 HTAP 服务架构指南（主从复制）

GreatSQL社区月报 | 2024.06

FILE+POS 方式 GreatSQL 主从复制架构给主节点磁盘扩容

展会 | GreatSQL亮相全球数字经济大会开源数据库赋能金融数字化转型

GreatSQL 中 Insert 慢是什么情况？

Percona Toolkit 神器全攻略（监控类）

官答丨操作系统升级 Openssl 导致 GreatSQL 无法启动

Percona Toolkit 神器全攻略（配置类）

GreatSQL HTAP探索之路

GreatSQL社区月报 | 2024.05

MySQL5.7 通过逻辑备份迁移到GreatSQL注意事项

Percona Toolkit 神器全攻略（实用类）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

加入微信交流群	加入QQ交流群