故障分析 | 查询 ps.data_locks 导致 MySQL hang 住

科技 2024-09-24 16:30 上海

作者：胡呈清，爱可生 DBA 团队成员，擅长故障分析、性能优化，个人博客：[简书 | 轻松的鱼]，欢迎讨论。

爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

本文约 1500 字，预计阅读需要 8 分钟。

1问题描述

MySQL 版本：8.0.26

跑批执行到 insert into t1 select * from t2 时，有一个定时任务运行 MySQL 巡检脚本，巡检脚本执行到 select * from performance_schema.data_locks、select * from performance_schema.data_lock_waits 会导致 MySQL hang，一开始只是某些 SQL 执行无响应，最终 MySQL 无法登录。

2分析过程

1. 开始 hang 时的线程状态

下图标记的两个线程中：

第一个线程完整的 SQL 是 insert into t1 select * from t2
第二个线程完整的 SQL 是 select * from performance_schema.data_lock_waits，这是巡检脚本里的 SQL，上一句是 select * from performance_schema.data_locks
其余线程全部都卡住了

2. 分析堆栈

分析等锁和互斥量的线程持有和正在等待的锁情况如下：

Thread 285 持有 LOCK_status，被 Thread 21 持有的 srv_innodb_monitor_mutex 阻塞
Thread 21 持有 srv_innodb_monitor_mutex，被未知线程持有的 trx_sys_mutex_enter() 即 trx_sys->mutex 阻塞
大量线程被 Thread 285 持有的 LOCK_status 阻塞
大量线程（包括 insert into..select 和查询 ps.data_lock_wait）阻塞在 trx_sys_mutex_enter()

现在的问题是没有找到哪个线程持有了 trx_sys->mutex 互斥量。

<<< 左右滑动见更多 >>>

3. 本地复现

调用存储过程，当执行到 insert into ... select... 时，另外一个 session 执行 select * from performance_schema.data_locks。

反复测试了很多次，后面找到了复现的必要条件：

执行 select * from performance_schema.data_locks 报错内存分配异常：ERROR 3044 (HY000): Memory allocation error: while scanning data_locks table in function rnd_next.

然后才能观察到 insert into ... select 卡住，堆栈显示这个线程在等 trx_sys->mutex。

复现截图：

insert into ... select 线程堆栈如下，不过分析所有线程堆栈后仍然找不到谁持有了 trx_sys->mutex。

4. 代码分析 trx_sys->mutex 结构

由于堆栈信息里找不到 trx_sys->mutex 互斥锁的持有者，想到的另外一个方法是用 gdb 打印出 trx_sys->mutex 结构，看其中是否有线程 ID 信息。

发现只有 debug 模式下才有线程 ID 信息，普通模式下没有，因此需要编译一个 debug 版本进行复现，然后用 gdb 打印出 trx_sys->mutex 互斥锁的持有者。

5. debug版本复现

当查询 ps.data_locks 触发内存分配报错后，通过 gdb 打印 insert into 线程的堆栈，卡在了 mutex_enter_inline：

然后打印查询 ps.data_locks 的线程堆栈，堆栈是正常的，但是打印 trx_sys->mutex 时发现持有者竟是它自己：

将 _M_thread 的值转换为 16 进制，就可以用来核对 gdb info thread 输出的的线程号：

gdb) p/x 140316922181376
$2 = 0x7f9e144d7700

6. 合理推测&找证据

经过 debug 版本上复现，发现查询 ps.data_locks 时触发内存分配错误，但是没有释放 trx_sys->mutex 互斥量。

于是合理推测：存在 bug，查询 ps.data_locks 时触发内存分配错误后，不会释放 trx_sys->mutex，导致内部死锁。

找到了这个 bug：https://github.com/mysql/mysql-server/commit/d6be2f8d23b1fe41f10c7147957faf68b117abb2

7. bug 解释

在 performance_schame.data_locks 的实现中，使用了 C++ try-catch 机制来处理读取 data_locks 记录时内存分配失败的异常情况。

在 table_data_locks.cc 文件的 table_data_locks::rnd_next 函数中：

代码解释：catch (const std::bad_alloc &) 用来捕获 std::bad_alloc 类型的异常，当 try 块中抛出 std::bad_alloc 异常时，调用 my_error 打印错误信息，并返回 ER_STD_BAD_ALLOC_ERROR，结束执行。

try 模块中的 iterator_done = it->scan(&m_container, true); 是实际执行的业务逻辑代码，it->scan 进行某种迭代扫描操作，结果存储在 iterator_done 变量中。catch 模块捕获的异常就是由这里抛出的。

it->scan 的定义在 p_s.cc 源码文件的 Innodb_data_lock_iterator::scan 函数中，执行逻辑很清晰：

trx_sys_mutex_enter() 先加 trx_sys->mutex 互斥锁
调用 scan_trx_list 扫码 rw_trx_list、mysql_trx_list 两个事务列表
trx_sys_mutex_exit() 释放 trx_sys->mutex 互斥锁

很显然，调用 scan_trx_list 扫描时如果发生 std::bad_alloc 内存异常，会直接被 catch 模块获取，抛出异常结束执行，无法执行到 trx_sys_mutex_exit() 释放互斥锁，导致了 trx_sys->mutex 互斥锁的残留。

这一点可以在 debug 版本复现时打印的 trx_sys->mutex 信息中得到证实：是在 p_s.cc 文件的第 592 行加上的。

3复现步骤

简化的复现步骤如下：

准备一个小内存的虚拟机，比如 2-4G，方便触发内存分配异常
造一张 500 万行的表 t1
执行 begin;select * from t1 for update;
执行 select * from performance_schema.data_locks; 触发报错 ERROR 3044 (HY000): Memory allocation error: while scanning data_locks table in function rnd_next.
继续查询 performance_schema.data_lock_waits 会被阻塞。

4结论

该故障成因如下：

跑批中 INSERT INTO t1 SELECT * FROM t2; 会对 t2 表所有行加 S Lock（原因：RR 隔离级别，并且无法走索引）。t2 表很大，有几亿行，会导致 performance_schema.data_locks 中有几亿个锁记录；
查询 ps.data_locks 时，由于记录数太多，消耗大量内存，触发内存分配异常。在 ps.data_locks 的实现中，内存分配异常是由 C++ try-catch 机制处理的，但是这个异常处理发生在 mutex lock 和 mutex unlock 之间，导致 mutex 不释放。本次故障就是执行 trx_sys_mutex_enter() 后迭代扫描锁记录时发生了内存分配异常，trx_sys_mutex_exit() 释放互斥锁的操作未执行，残留了下来；
由于 trx_sys->mutex 互斥锁在 InnoDB 中被大量使用，接下来巡检脚本查询 data_lock_waits 被阻塞，后台 purge 线程、innodb monitor 线程、元数据刷新进程、用户线程执行的业务 SQL 都被阻塞，最终会导致死锁。

5解决方案

官方在 8.0.37 中修复了这个 bug，可升级到 8.0.37 解决。
修复方式是在 ps.data_locks、data_lock_waits 的实现中去掉了 try-catch 这段代码，防止发生在 mutex lock 和 mutex unlock 之间处理异常，导致 mutex unlock 无法执行残留 mutex。
不要在行锁很多的情况下查询 ps.data_locks。

本文关键字：#MySQL# #锁# #源码#

故障分析 | 如何解决由触发器导致 MySQL 内存溢出？

技术分享 | 深入理解 MySQL 中的 SQL_MODE

技术分享 | MySQL Undo 工作机制历史演变

技术分享 | MySQL 隐式转换必知必会

技术分享 | MySQL VARCHAR 最佳长度评估实践

故障分析 | TCP 缓存超负荷导致的 MySQL 连接中断

故障分析 | 一则 MySQL 从节点 hung 死问题分析

紧急避坑 | MySQL 含有下划线的数据库名在特殊情况下导致权限丢失

✨ Github：https://github.com/actiontech/sqle

📚 文档：https://actiontech.github.io/sqle-docs/

💻 官网：https://opensource.actionsky.com/sqle/

👥 微信群：请添加小助手加入 ActionOpenSource

🔗 商业支持：https://www.actionsky.com/sqle

http://mp.weixin.qq.com/s?__biz=MzU2NzgwMTg0MA==&mid=2247517696&idx=1&sn=384cb520ef2232265b0d580479a00af8

爱可生开源社区

爱可生开源社区，提供稳定的MySQL企业级开源工具及服务，每年1024开源一款优良组件，并持续运营维护。

最新文章

SQL 质量管理 | 一键检测，全面掌控数据源连接状态

11/29 上海 | DAMS 峰会，了解 AI 技术在数据库中的应用与实践

MySQL 核心模块揭秘 | 41 期 | insert on duplicate 加锁分析（2）

直播文稿 | ChatDBA：数据库根因分析智能助手的实践与应用

直播活动 | Bob大叔《整洁架构之道》新书分享会

SQLE 3.2410.0 发布，轻松掌握数据库结构差异

技术译文 | EXPLAIN 迎来全新 JSON 格式

SQLE 3.2410.0 发布，轻松掌握数据库结构差异

雍正荐书 | P9 工作法，职场人的升级宝典

MySQL 核心模块揭秘 | 40 期 | insert on duplicate 加锁分析（1）

OB 运维 | Oracle 迁移到 OB 过程中的函数改造案例

明天合肥 | OceanBase城市交流会联合讯飞开源，共探AI与数据库未来！

OB 开发 | 多源数据库支持升级！达梦到 OceanBase，一步到位！

11/6 合肥 | OceanBase城市交流会联合讯飞开源，共探AI与数据库未来！

SQL 质量管理 | 结构对比：轻松掌握数据库结构差异

11/2-11/3 北京 | COSCon'24 | 爱可生邀您逛开源集市！

MySQL 核心模块揭秘 | 39 期 | 死锁案例分析（1）插入意向锁

OB 运维 | OAT 初始化报错？原来是 PAM 配置惹的祸！

故障分析 | MySQL 8.0 中多字段虚拟列引发的宕机

SQL 质量管理 | 一键转工单：SQL 工作台操作更省心

1024 | SQLE 三周年体验打卡活动，来啦~

MySQL 核心模块揭秘 | 38 期 | 非唯一索引范围查询加什么锁？

11/29 上海 | DAMS 中国数据智能管理峰会

OB 运维 | 进程崩溃定位难？日志分析五步安！

第 58 期：MySQL Slave 异常掉电后主从同步出现异常怎么排查？

SQL 质量管理 | 全局 Dashboard：一屏掌控全局

2024 OSCAR 开源产业大会在京召开

雍正荐书 | 数据建模和模式设计系列 - MongoDB

OB 运维 | OB4.X-Follower 节点时钟偏差导致合并卡住？

10/23 北京 | 2024 OceanBase 年度发布会亮点抢先看！

技术分享 | 数据库源码学习调试利器之 CGDB

SQLE 3.2409.0 发布，变更记录支持版本管理

10/18 上海 | AI革新软件：从底层到应用的全面升级！字节、阿里、腾讯齐聚 QCon

报名中 | 爱可生开源社区邀您参与天工开物“开源毕设”活动

MySQL 核心模块揭秘 | 36 期 | 非唯一索引等值查询加什么锁？

故障分析 | 哪些情况下 MySQL 配置文件会被截断？

10/16 北京 | 秋日相邀！与爱可生一起逛 OSCAR 开源产业大会开源市集

10/16 北京 | 2024 OSCAR 开源产业大会完整议程揭晓

SQL 质量管理 | 使用智能水印，守护您的数据安全

雍正荐书 | 这是一本成为 Redis 高手的秘籍！

9/27 线上 | 开源漫谈第 14 期

MySQL 核心模块揭秘 | 35 期 | 主键索引等值查询加什么锁？

故障分析 | 查询 ps.data_locks 导致 MySQL hang 住

紧急避坑 | MySQL 含有下划线的数据库名在特殊情况下导致权限丢失

当数据库有了Copilot，DBA不用再灭火了！

9/21 DataFunSummit2024：生成式AI技术峰会

OB 运维 | 存储过程慢？可能是 plan cache 失效了

9/21 深圳 | OceanBase 城市交流会解锁新玩法

MySQL 核心模块揭秘 | 34 期 | RC 隔离级别插入记录，唯一索引冲突加什么锁？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉