面试官：GROUP BY和DISTINCT有什么区别？

文摘 2024-09-19 08:40 陕西

面试题大全：www.javacn.site

在 MySQL 中，GROUP BY 和 DISTINCT 都是用来处理查询结果中的重复数据，并且在官方的描述文档中也可以看出：在大多数情况下 DISTINCT 是特殊的 GROUP BY，如下图所示：

“
官方文档地址：https://dev.mysql.com/doc/refman/8.0/en/distinct-optimization.html

但二者还是有一些细微的不同，接下来一起来看。

1.DISTINCT 介绍

用途：DISTINCT 用于从查询结果中去除重复的行，确保返回的结果集中每一行都是唯一的。
语法：通常用于 SELECT 语句中，紧跟在 SELECT 关键字之后。例如以下 SQL：

SELECT DISTINCT column1, column2 FROM table_name;

工作机制：DISTINCT 会对整个结果集进行去重，即只要结果集中的某一行与另一行完全相同，就会被去除。

2.GROUP BY 介绍

用途：GROUP BY 主要用于对结果集按照一个或多个列进行分组，通常与聚合函数（如 COUNT, SUM, AVG, MAX, MIN 等）一起使用，以便对每个组进行统计。
语法：GROUP BY 通常跟在 FROM 或 WHERE 子句之后，在 SELECT 语句的末尾部分。例如以下 SQL：

SELECT column1, COUNT(*) FROM table_name GROUP BY column1;

工作机制：GROUP BY 将数据按指定的列进行分组，每个组返回一行数据。

3.举例说明

3.1 使用 DISTINCT

假设有一个表 students，包含以下数据：

id	name	age
1	Alice	20
2	Bob	22
3	Alice	20

使用 DISTINCT 去除重复行：

SELECT DISTINCT name, age FROM students;

结果：

name	age
Alice	20
Bob	22

3.2 使用 GROUP BY

假设还是上面的表 students，我们想要统计每个学生的数量：

SELECT name, COUNT(*) AS count FROM students GROUP BY name;

结果：

name	count
Alice	2
Bob	1

4.主要区别

功能不同：DISTINCT 用于去除重复行，而 GROUP BY 用于对结果集进行分组，通常与聚合函数一起使用。
返回结果不同：DISTINCT 返回去重后的结果集，查询结果集中只能包含去重的列信息，有其他列信息会报错；GROUP BY 返回按指定列分组后的结果集，可以展示多列信息，并可以包含聚合函数的计算结果。
应用场景不同：DISTINCT 更适合单纯的去重需求，GROUP BY 更适合分组统计需求。
性能略有不同：如果去重的字段有索引，那么 GROUP BY 和 DISTINCT 都可以使用索引，此情况它们的性能是相同的；而当去重的字段没有索引时，DISTINCT 的性能就会高于 GROUP BY，因为在 MySQL 8.0 之前，GROUP BY 有一个隐藏的功能会进行默认的排序，这样就会触发 filesort 从而导致查询性能降低。

课后思考

count(*)、count(1) 和 count(字段) 有什么区别？

特殊说明

以上内容来自我的《Java 面试突击训练营》，这门课程是有着十几年工作经验（前 360 开发工程师），10 年面试官经验的我，花费 4 年时间打磨完成的一门视频面试课。

学完训练营的课程之后，基本可以应对目前市面上绝大部分公司的面试了，并且课程配备了 9 大就业服务，帮助上千人找到 Java 工作，其中上百人拿到大厂 Offer，学员最高薪资 70W 年薪，面试课目录和 9 大服务如下：

加我微信咨询：vipStone【备注：训练营】

http://mp.weixin.qq.com/s?__biz=MzkxOTcxNzIxOA==&mid=2247507327&idx=1&sn=d48b7f844e053d146b0d1dd568c0c2e7

磊哥和Java

小破站 www.javacn.site 面试题超全~

最新文章

面试官：说说MySQL主从复制实现原理？

如何快速拿到Offer？

面试官：聊聊Spring中Bean线程安全问题？

颠覆认知：MySQL创建索引时不锁表？

场景题：说一个内存溢出的场景和解决方案？

崩了啊，一个JWT把我干懵了。。。

一对一辅导服务！不满意，不收费？

Redis如何保证数据不丢失？

如何快速拿到Offer？

数字马力正在疯狂招人！

超全的SpringBoot常用注解！

团子东子开奖了，这泼天的富贵！

Sentinel是如何实现限流的？

深信服开奖了，比预期的高~

兄嘚，离职原因千万不要这样说！

25届开奖了，大厂薪资预览！

快速拿到Offer？

有Redis为什么还要本地缓存？谈谈你对本地缓存的理解？

目前0Offer要不要先找实习？

试用期被裁是有补偿的！一定要记得领取~

Javaer必看：3种分布式锁的具体实现！

现在才投简历还来得及吗？

SpringBoot如何实现缓存预热？

场景题：百万数据插入Redis有哪些实现方案？

快速搞定Offer！

面试官：谈谈你对零拷贝的理解？

面试官：Redis如何实现延迟任务？

25届秋招薪资开奖了

面试多起来了

离了大谱，和HR互怼后被开了！

面试官：禁用Cookie后Session还能用吗？

这个Offer开不开门？

为什么线下面试越来越流行了？

面试官：谈谈你对MySQL主从复制的理解？

如何快速搞定面试？

点击就送？这家公司的Offer挺好拿！

面试官最反感这样的简历！

某中厂面试凉经

10月才是秋招主战场！

放假了，但面试训练营随时可看！

秋招必备：如何有效的准备面试？

面试官：谈谈你对“零拷贝”的理解？

面试官：谈谈你对IO多路复用的理解？

面试官：项目中如何实现布隆过滤器？