【java面试100问】84 为什么不推荐使用数据库自增主键？也不推荐使用UUID作主键，用雪花算法会有什么问题？

文摘 2025-01-18 07:43 天津

为什么不推荐使用数据库自增主键？

自增主键，顾名思义，就是每次插入新记录时，主键值会自动递增。

虽然这种方法简单易用，但在很多场景下并不推荐，原因如下：

1. 安全性问题：自增主键容易被外部用户猜测，这可能导致安全漏洞。

比如，黑客可以通过简单的递增逻辑猜测下一条记录的主键，从而获取敏感数据。

2. 性能问题：在高并发环境下，自增主键可能会成为性能瓶颈。

多个节点同时插入数据时，需要协调生成主键，确保唯一性，这会增加系统的复杂性和延迟。

3. 数据分布不均：自增主键在数据库中的存储是按顺序插入的，这可能导致数据在磁盘上的分布不均，影响查询性能。
4. 难以实现多主分片架构：在多主分片架构中，确保主键的唯一性是一个挑战。

自增主键需要不同节点之间协调生成，增加了系统的复杂性和延迟。

为什么不推荐使用UUID作主键？

UUID是一种全局唯一标识符，虽然它解决了自增主键的很多问题，但也有一些显著的缺点：

1. 性能问题：UUID是随机生成的，每次插入数据时，新的UUID可能需要插入到索引树的中间位置，这可能导致频繁的页分裂，降低性能。
2. 占用内存：UUID通常是一个较长的字符串（36个字符），相比整数主键，它占用的内存更多，这也会影响索引树的效率。
3. 索引效率低：由于UUID是随机生成的，索引效率通常低于有序的整数主键。

雪花算法会有什么问题？

雪花算法（Snowflake）是Twitter提出的一种分布式自增ID算法，它生成的ID是全局唯一的，并且大致递增。

虽然雪花算法在很多场景下表现优异，但也有一些潜在的问题：

1. 依赖系统时间：雪花算法依赖系统时间生成ID，如果系统时间被回调或改变，可能会导致ID冲突或重复。
2. 时钟同步问题：在分布式系统中，不同机器上的时钟可能无法完全同步，这可能导致生成的ID不是全局递增的。

虽然这通常不会影响ID的唯一性，但在某些严格要求递增的场景下可能不适用。

3. 节点数量限制：雪花算法中用于记录工作机器ID的位数是有限的（通常是10位），这意味着最多只能支持1024个节点。

如果节点数量超过这个限制，就需要进行额外的扩展。

示例代码

下面是一个简单的雪花算法Java实现示例：

public classSnowflakeIdGenerator {
    // 其他常量、变量和方法...

    // 构造函数
    publicSnowflakeIdGenerator(long datacenterId, long machineId) {
        if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) {
            thrownewIllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0");
        }
        if (machineId > MAX_MACHINE_NUM || machineId < 0) {
            thrownewIllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0");
        }
        this.datacenterId = datacenterId;
        this.machineId = machineId;
    }

    // 生成下一个ID
    publicsynchronizedlongnextId() {
        longcurrStmp= getNewstmp();
        if (currStmp < lastStmp) {
            thrownewRuntimeException("Clock moved backwards. Refusing to generate id");
        }
        if (currStmp == lastStmp) {
            sequence = (sequence + 1) & MAX_SEQUENCE;
            if (sequence == 0L) {
                currStmp = getNextMill();
            }
        } else {
            sequence = 0L;
        }
        lastStmp = currStmp;
        return ((currStmp - START_STMP) << TIMESTAMP_LEFT) |
               (datacenterId << DATACENTER_LEFT) |
               (machineId << MACHINE_LEFT) |
               sequence;
    }

    // 其他辅助方法...
}

总结

选择数据库主键时，需要根据具体场景和需求进行权衡。

自增主键简单易用，但在高并发、分布式环境下可能存在问题；

UUID虽然解决了自增主键的很多问题，但性能上可能不如整数主键；

雪花算法则是一种折中的方案，但在实际应用中也需要考虑时钟同步、节点数量限制等问题。

希望文章能给大家带来点技术收获。也希望大家能够点赞、收藏、转发，让知识成为大家的财富。你的支持，是我最大的动力！

你诺喜欢，请点个关注哦

大家可以发送消息：202501

领取计算机黑皮书191本（1月有效）

最新文章

【2025版SpringCloud面试题】2、Nacos如何实现配置持久化？

【2025版SpringCloud面试题】1、Nacos如何实现高可用？

【java面试100问】100 Mysql为什么使用B+树作为索引结构？

【java面试100问】99 如何使用redis记录上亿用户连续登录天数？

【java面试100问】98 MySQL事务的实现原理是什么？

【java面试100问】97 finally语句块一定会执行吗？

【java面试100问】96 Java反射的优缺点是什么？

【java面试100问】95 JDK动态代理为什么只能代理有接口的类？

【java面试100问】94 new String(“abc”)到底创建了几个对象？

【2025版Spring面试题】2 Spring是如何解决Bean的循环依赖的？

【java面试100问】93 在亿级别的数据库中，快速把uid=4的数据查出来，其中uid=4的数据有很多？

【2025版Spring面试题】1 Bean的生命周期

【java面试100问】92 什么是索引下推？什么是索引覆盖？什么是回表？

SpringBoot读取配置文件原理和加载顺序优先级

【java面试100问】92 Mybatis是如何进行分页的？

Spring在多线程环境下能不能保证事务一致性？如何解决？

【java面试100问】91 Spring中有两个相同的id会报错吗？

MySQL 执行一条查询语句的内部执行过程

【java面试100问】90 Integer和int的区别，Java为什么要设计封装类？

【java面试100问】89 lock和synchronized的区别？

【java面试100问】88 Redisson分布锁的实现原理？

【java面试100问】87 Thread.sleep(0)有意义吗？

【java面试100问】86 谈谈Springboot自动装配的流程？

【java面试100问】85 请你介绍一下mybatis的缓存机制？

【java面试100问】83 MySQL如何实现将数据实时同步到ES ？

【java面试100问】81 Spring MVC核心是什么，以及它的执行流程？

【java面试100问】82 count(1)和count(*)和count(字段)区别？

SpringBoot内置Tomcat启动原理？

【java面试100问】81 BeanFactory和FactoryBean区别？

【java面试100问】80 Mybatis如何实现动态数据源？

【java面试100问】79 如何用两个线程轮流输出0到200的值？

【java面试100问】75 过滤器和拦截器有什么区别？

【java面试100问】74 如何实现二维码扫码登录？

【java面试100问】78 Redis主从如何保证数据的一致性？

【java面试100问】77 讲解下JDK的动态代理

请说一下MySQL的共享锁和排他锁

【java面试100问】76 什么是幂等？如何解决幂等性？

【java面试100问】73 请说一下对象的创建过程？

【java面试100问】72 把一张一亿条数据的表迁移到另外一个数据库中如何实现？

【java面试100问】71 解释一下Java的内存模型和happens-before规则？

【java面试100问】70 OpenFeign第一次调用为什么会很慢？

【java面试100问】69 限流策略有哪些，滑动窗口算法和令牌桶区别，使用场景

【java面试100问】68 订单表每天新增500W数据，分库分表的方案应该如何设计？

【java面试100问】67 为什么垃圾回收要分Eden区和Survior区？

【java面试100问】66 AQS唤醒节点时，为何从后往前找？

【java面试100问】65 为什么不能用浮点型表示金额？

【java面试100问】64 如何不停机进行数据迁移？

java面试100题讲解源文件markdown格式

【java面试100问】63 线上几百万的消息积压如何处理？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉