深入理解MySQL COUNT函数：避免常见陷阱与性能优化

文摘 2024-12-12 09:30 山东

写本篇文章的最初原因是因为一个线上事故，分页统计结果少了几 K 的数据，吓死个人。
COUNT 函数在 MySQL 中是一种非常重要的聚合函数，用于计算满足特定条件的行数。它可以用于统计查询结果的行数、计算某个列的非重复值数量以及计算满足特定条件的行数等。
COUNT 函数无疑是非常重要的，用错所导致的影响也是相当巨大，本文将详细介绍一下 COUNT 的四大陷阱和性能优化

一、陷阱一：COUNT(*) VS COUNT(column)

在 SQL 查询中，COUNT(*)和 COUNT(column)是用于计算行数的两种常见方式。它们之间存在一些陷阱和区别。

1.1 COUNT(*)

语法：

SELECT COUNT(*) FROM table_name;

COUNT(*)用于计算整个表中的行数，包括所有的行，无论是否包含NULL值。

由于不需要指定具体的列名，因此它更简洁和方便。

陷阱：当使用COUNT(*)时，数据库引擎需要遍历整个表来计算行数，可能会导致性能问题，特别是对于大型表而言。

1.2 COUNT(column)

语法：

SELECT COUNT(column) FROM table_name;

COUNT(column)用于计算指定列中非 NULL 值的行数。

可以指定具体的列名，只计算该列中非 NULL 值的行数。

陷阱：当使用COUNT(column)时，如果指定的列包含 NULL 值，那么这些 NULL 值将不会被计算在内。因此，如果你需要计算包括 NULL 值的行数，应该使用COUNT(*)而不是COUNT(column)。

前面已经说清楚了，COUNT(*) VS COUNT(column)的陷阱以及COUNT和NULL的关系，下面罗列一些常见情况和对应的结果解释：

如果使用COUNT(*)或COUNT(column)时，查询结果集中没有匹配的行，则 COUNT 函数的返回值为 0，即使列中包含 NULL 值。
如果使用COUNT(column)时，查询结果集中只有 NULL 值的行，则 COUNT 函数的返回值为 0，因为它只计算非 NULL 值的行数。
如果使用COUNT(*)时，查询结果集中只有 NULL 值的行，则 COUNT 函数的返回值为包含 NULL 值的行数。
如果使用COUNT(*)或COUNT(column)时，查询结果集中既有 NULL 值的行，又有非 NULL 值的行，则 COUNT 函数的返回值将包括非 NULL 值的行数。

二、COUNT 和 DISTINCT

COUNT 和 DISTINCT 是两个常用的聚合函数，用于计算行数和去重操作。

DISTINCT 关键字用于对查询结果进行去重操作。

它可以应用于 SELECT 语句中的一个或多个列，返回唯一的值，去除重复的行。

语法如下：

-- 对多个列进行去重
SELECT DISTINCT column1, column2 FROM table_name;

-- 对满足条件的列进行去重
SELECT DISTINCT column FROM table_name WHERE condition;

需要注意的是，COUNT 和 DISTINCT 可以结合使用，以计算去重后的行数。例如，使用 COUNT(DISTINCT column)可以计算某一列的去重后的值的数量。

语法如下：

-- 计算某列的去重后的值的数量
SELECT COUNT(DISTINCT column) FROM table_name;

三、多表连接的 COUNT

在多表联接查询中，如果你想要计算符合条件的行数，可以使用 COUNT 函数结合联接操作来实现。

先来看一个案例：

SELECT
 COUNT(*) AS row_count
FROM
 x_user AS u
 JOIN x_user_extend AS e ON u.id = e.uid
WHERE
 1 = 1;

在上面的案例中，我们使用了COUNT(*)函数来计算满足连接条件和其他条件的行数。x_user和x_user_extend通过列id进行连接。最后，使用 AS 关键字给计算结果取了一个别名 row_count。注意：上面 COUNT()将计算满足条件的行数，无论在连接后的结果中是否存在重复的行。

如果你只想计算去重后的行数，可以使用COUNT(DISTINCT column)来代替COUNT()，其中 column 是一个具有唯一值的列。

上案例：

SELECT
 COUNT(DISTINCT u.id) AS row_count
FROM
 x_user AS u
 JOIN x_user_extend AS e ON u.id = e.uid
WHERE
 1 = 1;

在上面的案例中，我们使用COUNT(DISTINCT table1.column)来计算去重后的行数。

最后，小结一下

四、性能问题

在没有索引的情况下，COUNT()操作可能会非常慢，尤其是当表中的数据量很大时。这是因为 MySQL 需要扫描整个表来计算行数。
对于COUNT(*)，MySQL 8.0.13 及以后的版本对 InnoDB 表进行了优化，提高了单线程工作负载下的查询性能。

特别注意：InnoDB 引擎会尝试使用数据量较小的非聚簇索引来优化COUNT()查询。如果没有合适的索引，查询可能会使用全表扫描，导致性能下降。

五、总结

了解了这些“坑”之后，为了避免这些“坑”，建议在设计数据库时考虑使用合适的索引，以及在可能的情况下，使用COUNT(DISTINCT column)来确保统计的准确性。

同时，了解不同存储引擎的特性和 MySQL 版本的优化也很重要。

在处理大量数据时，考虑使用其他方法，如定期的批处理或使用缓存策略，来减轻数据库的负担。

希望本文对您有所帮助。如果有任何错误或建议，请随时指正和提出。
同时，如果您觉得这篇文章有价值，请考虑点赞和收藏。这将激励我进一步改进和创作更多有用的内容。
感谢您的支持和理解！

来源：https://juejin.cn/post/7337959220748730368
作者：竹子爱揍功夫熊猫

Java驿站

这里是【Java驿站】，一个Java编程学习与交流平台。

最新文章

使用 SpringAOP 对 IN 查询进行多线程拆分效率提升巨大

DeepSeek：国产之光重塑 AI 未来

如何用形象的比喻描述大数据的技术生态？Hadoop、Hive、Spark 之间是什么关系？

竟然还有人不知道 Java 的内省机制

祥龙辞旧岁，金蛇纳新福！

探究 map 为什么不能遍历的同时进行增删操作

BigDecimal 为什么可以不丢失精度？

使用规则引擎改造任务系统

美团面试：new Integer("127") 和 Integer.valueOf("128") 有什么区别

基于 @Transactional 的声明式事务原理剖析

JMH - Java 微基准测试工具

CPU 飙升原因及处理方案

面试官：Spring 是如何管理事务的

Java for 循环嵌套，你需要懂的代码性能优化技巧

一次线上慢 SQL 调优分享

面试官：说下 LinkedList 的实现原理

农银一面：Filter、Interceptor、Spring AOP 的执行顺序

SpringBoot 中的扩展接口，必须了解！

放弃 Websocket 使用 SSE 才发现这些功能两三行代码就搞定了！

三方接口调用设计方案

别再乱写工具类了！Spring 内置工具类分享，快收藏起来吧~

你真的了解 ArrayList 吗？（下）

你真的了解 ArrayList 吗？（上）

深入理解MySQL COUNT函数：避免常见陷阱与性能优化

SpringBoot 优雅参数校验

面试官：说下对 Java 中异常的理解（详解 Java 异常机制）

常用工具分享

谁还不懂规则引擎?

没有实际的高并发经验，面试如何吹一波牛？

Spring Bean 是单例的吗？如何保证并发安全？

面试官：Java 的 SPI 都不了解？这很难让你通过啊！

技术大佬问我，Kafka 为什么这么的快？

面试官：为什么threadLocal有自动清除机制还存在内存泄漏？

工作中 Spring Boot 五大实用小技巧，来看看你掌握了几个？

SpringBoot 自动装配原理

Java基础面试：数据类型

Java基础面试：面向对象三大特性

Java基础面试：可变长参数

AI 小助手发布，开启全新互动体验，快来对话吧~

Java基础面试：Java中的方法

Java基础面试：关键字与注释

Java基础概念知识（一）

接口安全：防篡改和防重放

为何忘记密码后要重置而不是找回？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉