首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

美团面试：5大MySQL聚集索引和非聚集索引的区别？

文摘 2024-09-24 13:00 四川

关注△mikechen的架构笔记△，十余年BAT架构经验倾囊相授

大家好，我是mikechen。

聚集索引和非聚集索引的区别是MySQL面试经常提及的问题，以下我一一来详解两者的核心区别@mikechen

最新mikechen原创超30万字《阿里架构师进阶专题合集》和《最全大厂面试题及答案总结》，请关注本公众号【mikechen的架构笔记】，后台回复：资料，即可领取。

什么是索引结构？

索引在数据库中的作用类似于目录在书籍中的作用，用来提高查找信息的速度。

索引在MySQL中也叫做“键（key）”, 是存储引擎用于快速找到记录的一种数据结构,使用索引查找数据，无需对整表进行扫描，可以快速找到所需数据。

索引对于良好的性能非常关键,尤其是当表中的数据量越来越大时，索引对性能的影响跃愈发重要。

什么聚集索引？

聚集索引也称聚类索引、簇集索引，就是存放的物理顺序和列中的顺序一样，一般设置主键索引就为聚集索引。

所以要想搞懂聚集索引，你需要搞懂主键。

可能有小伙伴会问，为什么需要主键？如果建表的时候没有指定主键呢？聚集索引怎么操作，下面mikechen一一详解。

如果在创建表时没有显示的定义主键，则InnoDB存储引擎会按如下方式选择或创建主键：

首先判断表中是否有非空的唯一索引，如果有，则该列即为主键，如果有多个非空唯一索引时，InnoDB存储引擎将选择建表时第一个定义的非空唯一索引作为主键。
如果不符合上述条件，InnoDB存储引擎自动创建一个6字节大小的指针作为索引。

假设一个页(16K)只能存放3条数据，则数据存储结构如下：

可以看到我们想查询一个数据或者插入一条数据的时候，需要从最开始的页开始，依次遍历每个页的链表，效率并不高。

我们可以给这页做一个目录，保存主键和页号的映射关系，根据二分法就能快速找到数据所在的页。

所以这就主键的作用，相当于书的目录索引，可以提升查找数据效率。

但这样做的前提是这个映射关系需要保存到连续的空间，如数组这样做会有如下几个问题：

随着数据的增多，目录所需要的连续空间越来越大，并不现实。
当有一个页的数据全被删除了，则相应的目录项也要删除，它后面的目录项都要向前移动，成本太高。

我们可以把目录数据放在和用户数据类似的结构中，如下所示：

备注：目录项有2个列，主键和页号

数据很多时，一个目录项肯定很多，毕竟一个页的大小为16k，我们可以对数据建立多个目录项目，在目录项的基础上再建目录项，如下图所示：

这其实就是一颗B 树，也是一个聚集索引，即数据和索引在一块，叶子节点保存所有的列值。

以 InnoDB 的一个整数字段索引为例，这个 N 差不多是 1200，这棵树高是 4 的时候，就可以存 1200 的 3 次方个值，这已经17 亿了。

考虑到树根的数据块总是在内存中的，一个 10 亿行的表上一个整数字段的索引，查找一个值最多只需要访问 3次磁盘。其实，树的第二层也有很大概率在内存中，那么访问磁盘的平均次数就更少了。

聚簇索引具有唯一性，由于聚簇索引是将数据跟索引结构放到一块，因此一个表仅有一个聚簇索引。

什么是非聚集索引？

讲完聚集索引，接下来聊一下非聚集索引，也就是我们平时经常提起和使用的常规索引。

在innodb中在聚簇索引之上创建的索引称之为辅助索引，非聚集索引都是辅助索引，像复合索引、前缀索引、唯一索引都是辅助索引。

辅助索引叶子节点存储的不再是行的物理位置，而是主键值，辅助索引访问数据总是需要二次查找，如下图所示：

非聚集索引：数据存储在一个地方，索引存储在另一个地方，索引带有指针指向数据的存储位置。

聚集索引与非聚集索引的区别？

1.通过聚集索引可以一次查到需要查找的数据，而通过非聚集索引第一次只能查到记录对应的主键值，再使用主键的值通过聚集索引查找到需要的数据。

2.聚集索引一张表只能有一个，而非聚集索引一张表可以有多个。

3.使用聚集索引的查询效率要比非聚集索引的效率要高，但是如果需要频繁去改变聚集索引的值，写入性能并不高，因为需要移动对应数据的物理位置(时间花费在“物理存储的排序”上)。

4.非聚集索引则就是普通索引了，仅仅只是对数据列创建相应的索引，不影响整个表的物理存储顺序。

5.聚集索引存储记录是物理上连续存在，而非聚集索引是逻辑上的连续，物理存储并不连续。

以上

最后送大家一个福利：

送我原创超30万字阿里架构师进阶专题合集。

以及给大家整理最全大厂Java面试题及答案详解，包含：Java、多线程、JVM、Spring、MySQL、Redis、中间件...等必考题答案详解。

需要以上架构专题&面试答案的同学，加我微信即可领取！

添加时备注：资料

http://mp.weixin.qq.com/s?__biz=MzI2MTMwMTkxMQ==&mid=2247488658&idx=1&sn=7954419c1d34753cda3d89b04d730619

mikechen的架构笔记

十余年BAT架构经验倾囊相授!

最新文章

Docker和K8S的区别详解(图文全面总结)

美团面试：MySQL乐观锁是什么？谈谈底层实现原理？

TPS多少才算高并发(看这篇就够了)

Nginx常用配置详解(图文全面总结)

美团面试：谈谈http和https？哪5大区别？

美团面试：Redis是单进程单线程？支持多线程？

Nginx最全教程(万字图文总结)

云计算是什么(看这篇就够了)

QPS多少才算高并发(看这篇就够了)

美团面试：什么是Java对象头？底层实现机制？

4款Mongodb可视化管理工具(必用推荐)

K8S和Docker区别详解(5大核心区别)

kafka和rabbitmq的区别(6大区别详解)

消息中间件MQ最全详解(图文全面总结)

SOA和微服务区别详解(5大核心区别)

美团面试：什么是TCP粘包？TCP粘包的原因？TCP粘包的解决方案？

美团面试：长连接和短连接的区别？哪5大区别？

JVM调优实战(手把手教你5大步骤)

JVM调优实战详解(手把手教你5大步骤)

云原生技术应用详解(8大主流应用场景)

Java线程池拒绝策略详解(4种常见策略)

美团面试：5大MySQL聚集索引和非聚集索引的区别？

阿里面试：谈谈SpringBean生命周期？哪8大阶段？

阿里面试：MySQL死锁的原因？解决方案有哪些？

美团面试：什么是泛型擦除？泛型擦除原理机制？

9大SpringMVC常用注解详解(建议收藏)

并发和并行区别详解(图文全面总结)

阿里面试：谈谈Spring IOC的实现原理？启动步骤？

5大序列化方式详解(非常全面总结)

美团面试：Redis和Memcached有哪些核心区别？如何选型？

阿里二面：Redis是单线程还是多线程？为什么这么设计？

高并发架构设计详解(图文全面总结)

分布式和微服务区别详解(4大核心区别)

ShardingJDBC最全详解(图文全面总结)

SpringBoot注解最全详解(9大常用注解)

MySQL事务隔离级别详解(4大隔离级别图解)

如何保证线程安全?5种常见方法详解

数据库死锁最全详解(6大解决方案)

Dubbo和SpringCloud架构区别详解(4大核心区别)

云计算技术最全详解(图文全面总结)

SpringBoot整合Kafka详解(手把手教你4步成功)

JConsole最全详解(图文全面总结)

9大SpringBoot核心注解详解(建议收藏)

Kubernetes(K8S)最全详解(万字图文总结)

Nginx配置文件详解(万字图文总结)

Docker Hub最全详解(图文全面总结)

ThreadLocal最全详解(实现原理及用法使用)

ConcurrentHashMap最全详解(含JDK1.7和1.8原理剖析)

数据库分库分表详解(图文全面总结)

微服务部署架构最全详解(图文全面总结)

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉