区区 1 万张表就把 MySQL 给整崩溃了

科技 2024-07-17 11:50 浙江

Percona 资深工程师 Marco Tusa 近日爆料称，升级到 MySQL 8.0.38 版本后，当实例中的表个数超过一万个，实例重启后会发生 Crash 而失败，即便是重启时加上 validate_tablespace_paths=OFF 也不行。

这个问题在 >= 8.0.38 版本中存在，包括 8.4.1 和 9.0.0。

详细复现过程参见：https://perconadev.atlassian.net/browse/PS-9306。

用 MySQL 9.0.0 版本测试：

-- 创建一个最简单的表，并写入数据
> CREATE DATABASE test;
> USE test;
> CREATE TABLE t_1 (
  `id` int NOT NULL,
  PRIMARY KEY (`id`)
);

> INSERT INTO t_1 SELECT 1;

然后反复创建类似上面的表，表个数达到 1 万。

> SELECT COUNT(*) FROM information_schema.tables WHERE TABLE_SCHEMA ='test';
+----------+
| count(*) |
+----------+
|    10000 |
+----------+

之后重启实例，就能看到日志里有类似下面的内容，启动失败：

[Note] [MY-012207] [InnoDB] Using 2 threads to scan 10002 tablespace files
[Note] [MY-012200] [InnoDB] Thread# 0 - Checked 876/10002 files
...
[Note] [MY-012201] [InnoDB] Checked 10002 files
[Note] [MY-012208] [InnoDB] Completed space ID check of 10004 files.
...
2024-07-12T06:48:14Z UTC - mysqld got signal 11 ;
Signal SIGSEGV (Address not mapped to object) at address 0x508
Most likely, you have hit a bug, but this error can also be caused by malfunctioning hardware.
BuildID[sha1]=7f06a4743d7801096bd81bc999201fdbca43a12c
Thread pointer: 0x0
Attempting backtrace. You can use the following information to find out
where mysqld died. If you see no messages after this, something went
terribly wrong...
stack_bottom = 0 thread_stack 0x100000

[root@db160 mysql-9.0.0-linux-glibc2.17-x86_64-minimal]#  #0 0x103f726 <unknown>
 #1 0x103fa8c <unknown>
 #2 0x7f18f666ac1f <unknown> at sysdeps/unix/sysv/linux/x86_64/sigaction.c:0
 #3 0x218a7be <unknown>
 #4 0x21705a7 <unknown>
 #5 0x2b1d263 <unknown>
 #6 0x7f18f6660179 start_thread at /usr/src/debug/glibc-2.28/nptl/pthread_create.c:479
 #7 0x7f18f4811dc2 <unknown> at sysdeps/unix/sysv/linux/x86_64/clone.S:95
 #8 0xffffffffffffffff <unknown>
The manual page at http://dev.mysql.com/doc/mysql/en/crashing.html contains
information that should help you find out what is causing the crash.

确实挺拉胯的。

除了上面的测试用例，还测试了几种情形：

1、从 8.0.38 降级到 8.0.37、36、35 都是OK的，可以重新拉起，不报错；

2、拉起后删掉多余的表后再次用 8.0.38 也可以拉起；再次降级回 8.0.35 后又升级回 8.0.38 还是正常。

结论：

1、8.0.35 - 8.0.38 间可以反复升级、降级操作不影响，仅限我的测试场景，更复杂场景不能保证也 OK。

2、降级到 8.0.34 后就开始跪了，没再继续往下测试。

MySQL 8.0 手册和 release notes 里都没有说允许 8.0.35-8.0.38 间相互升降级，但目前简单测试是 OK 的。

当然，还是有办法可以规避的，也就是采用 共享/通用 表空间方案，例如：

-- 1. 共享表空间方案
> SET GLOBAL innodb_file_per_table = 0;
> CREATE TABLE ...;

-- 2. 通用表空间方案
> CREATE TABLESPACE test ADD DATAFILE 'test.ibd';
> CREATE TABLE t_1(...) TABLESPACE=test;

上述方案我已经验证过。

说下我个人看法，这个 Bug 虽很 low，但这个问题很小，也很容易规避。

MySQL 最近表现确实很辣鸡，但我依然热爱它。。。这算不算罗曼罗兰说的那种英雄主义，咱就是这么乐观，哈哈哈。

最后，看看 AliSQL 的内核开发者对引发此问题的 bug (#bug115517) 进行的深入分析。他曾在 AliSQL 上做了海量表场景下的启动优化，使百万表 Recovery 启动时间从 500 多秒缩短到 20 多秒。

详情查看：https://bugs.mysql.com/bug.php?id=115569

推荐阅读点击标题可跳转

1、图解 SQL 的执行顺序，优雅

2、MySQL 9.0“创新版”已支持向量，为何甲骨文却“偷偷摸摸”地宣布？

3、OpenAI 突然收购实时分析数据公司，传统数据库厂商：快来，OpenAI 又带我们玩了

http://mp.weixin.qq.com/s?__biz=MzA5ODM5MDU3MA==&mid=2650890413&idx=1&sn=4c2d09a31b07122fce18509df95c6b90

数据分析与开发

「数据分析与开发」分享数据分析与开发相关技术文章、教程、工具

最新文章

裁员了，很严重，大家做好准备吧！

为什么数据库连接很消耗资源？被问根本答不出来……

离谱！裁员裁出新高度了。。

低级失误导致 Elasticsearch 仓库 404，7万多 star 一夜清空，网友：只是手滑了？！

字节回应大模型训练被实习生攻击

取代数据岗，某司从业人员已集体转行....

千万级数据的全表 update 正确姿势

京东：MySQL 中的 distinct 和 group by 哪个效率更高？太刁钻！

发现一款JSON可视化工具神器，惊艳了！

突发！上交所系统被买崩了？股票交易量火爆挤瘫系统，IT 部门天塌了！

开源 9 年后，词频数据库 wordfreq 宣布停止更新，创始人：网上全是垃圾，OpenAI 和谷歌要为此付出代价

离谱，一边在裁员，一边在高薪招人！

又“刑”了！搞瘫公司三千多工作电脑，不给 500 万就删 IT 账户，网友：快乐的员工谁干这事儿啊

“神仙外企”、“IT养老院”前员工忆往昔：曾经是乌托邦、工资多得花不完只能买房

3个完美替代 Navicat 的工具，香！

3 年后，Elasticsearch 再次开源

IBM中国研发部彻底关闭！3分钟会议千人被裁，赔偿N+3

不要再在 pandas 循环中使用 loc/iloc 了！

拒绝背锅！39 岁失业后，我写出了一个超一万亿使用量的数据库

全体数据从业者请做好随时失业的准备！

说下 10 个高级的 SQL 查询技巧

多人同时导出 Excel 干崩服务器！新来的阿里大佬给出的解决方案太优雅了！

“列数已达上限”：史上最烂代码库的“绝命”一击

40+指标银行BI指标体系！万字详述银行实现全面自助分析

区区 1 万张表就把 MySQL 给整崩溃了

取代数据岗，某司数据从业人员已集体转行....

图解 SQL 的执行顺序，优雅

MySQL 9.0“创新版”已支持向量，为何甲骨文却“偷偷摸摸”地宣布？

OpenAI 突然收购实时分析数据公司，传统数据库厂商：快来，OpenAI 又带我们玩了

被全球最大用户弃用！曾经的数据库霸主 HBase 正在消亡

“鸭子数据库”DuckDB正式发布1.0稳定版：C++引擎代码超30万行、百万级月下载量

Pandas 常用操作图解

Tabby，一个 5 万星标的终端工具

使用sklearn高效进行数据挖掘！

离谱！一边裁员，一边高薪招人！

五分钟看懂 MySQL 编解码原理

如何使用 sklearn 优雅地进行数据挖掘？

多人同时导出 Excel 干崩服务器！新来的阿里大佬给出的解决方案太优雅了！

数据库表设计的18条军规

面试官：MySQL 上亿大表，如何深度优化？

换掉ES！Redis官方搜索引擎来了，效率大幅提升

我试了试用 SQL查 Linux日志，好用到飞起

13 秒插入 30 万条数据，批量插入正确的姿势！

AI编程语言Mojo正式开源标准库，宣称比Python快9万倍

深信服：开除 42 人、1 人被刑事立案

Redis只能做缓存？太out了！

公司新来一个技术总监：谁再在 SQL 中写 in 和 not in，直接走人！

被问懵了，加密后的数据如何进行模糊查询？

开源 Redis 的生命将就此终结？Redis 之父回应分叉浪潮：未来谁能领先，各凭本事！

微软开抢年收入上亿美元的 Redis 饭碗？开源性能遥遥领先的 Garnet：无需修改，Redis 客户端可直接接入

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉