明明表中没这条数据，竟然还能查出来？

科技 2024-11-06 08:20 四川

大家好，我是苏三，又跟大家见面了。

前言

当你看到这个标题时，第一反应可能是想：标题搞错了吧？

答：没搞错，各位看官，听我慢慢道来。

我之前写过一篇文章《明明加了唯一索引，为什么还是产生重复数据？》，发表之后，被很多博主转载过，引起了全网很多读者的共鸣。

我最近发现，这类出人意料的线上问题，加上知识点总结，加上干货分享，更容易吸引读者。

所以，这篇文章将会延续上篇文章的风格，从一个线上问题开始。

1.还原问题现场

有一天下午，有用户反馈说，它自定义的品牌：yoyo，一直都添加不成功。

我查了一下服务器的日志，并没有异常。

在我们的创建商品页面，用户可以选择已有品牌，也可以自己自定义新的品牌。

前端做了一个品牌的下来列表，为了方便用户查找，支持搜索。

用户可以输入关键字搜索品牌。

如果下拉框中出现了，则可以选择使用。

如果下拉框中没有数据，则在输入框中标识这个品牌是用户自定义的品牌。

然后通过创建商品接口，将该品牌添加到数据库当中。

现在的问题是yoyo这个品牌，用户自定义了，但不能保存到数据库当中。

这就非常奇怪了。

2 分析问题

为了查明这个问题，我先查询了数据库中的品牌表：

select * from brand where `name`='yoyo';

确实没有查出yoyo这个品牌。

但意外查出YOYO这个品牌。

它是yoyo英文字母的大写。

奇怪，我们查小写的yoyo字符串，为什么会把大写的YOYO查出来了？

于是，我查了brand表的表结构。

CREATE TABLE `brand` (
  `id` bigint NOT NULL AUTO_INCREMENT COMMENT 'ID',
  `name` varchar(30) NOT NULL COMMENT '品牌名称',
  `create_user_id` bigint NOT NULL COMMENT '创建人ID',
  `create_user_name` varchar(30) NOT NULL COMMENT '创建人名称',
  `create_time` datetime(3) DEFAULT NULL COMMENT '创建日期',
  `update_user_id` bigint DEFAULT NULL COMMENT '修改人ID',
  `update_user_name` varchar(30)  DEFAULT NULL COMMENT '修改人名称',
  `update_time` datetime(3) DEFAULT NULL COMMENT '修改时间',
  `is_del` tinyint(1) DEFAULT '0' COMMENT '是否删除 1：已删除 0：未删除',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci  COMMENT='品牌表';

品牌表使用的存储引擎ENGINE是InnoDB，为了保证表的事务性。

字符集CHARSET用的utf8mb4，可以保存一些表情符号等特殊字符。

校对规则COLLATE用的utf8_unicode_ci。

字符集是一组符号和编码的集合，而校对规则是用于比较字符集中字符的规则。

例如，utf8mb4字符集支持存储Unicode字符，而utf8mb4_0900_ai_ci校对规则定义了如何比较这些字符。

在MySQL中使用show collation指令，可以查看到所有COLLATE。

以utf8mb4为例，该编码所支持的所有COLLATE如下图所示。

主要包含了三种：

以_ci结尾的。
以_bin结尾的。
以_cs结尾的。

ci是case insensitive的缩写，意思是大小写不敏感，即忽略大小写。

cs是case sensitive的缩写，意思是大小写敏感，即区分大小写。

还有一种是bin，它是将字符串中的每一个字符用二进制数据存储，区分大小写。

使用最多的是 utf8mb4_general_ci（默认的）和 utf8mb4_bin。

我们的brand表，使用的COLLATE是utf8mb4_general_ci，它不区分大小写。

难怪下面的这条sql：

select * from brand where `name`='yoyo';

数据库中明明没有小写的yoyo这条数据，但却能把大写的YOYO数据查出来。

3.如何解决问题？

知道原因了，就好办了。

第一个想到的是把brand表的COLLATE改成utf8mb4_bin不就搞定了？

这样确实可以非常快速解决问题。

但我仔细想了一下。

品牌这种基础数据，yoyo和YOYO正常情况下应该是同一个品牌，应该只有一个id，不区分大小写才是正确的做法。

如果brand表的COLLATE改成了utf8mb4_bin，区分大小写，不就会出现两个不同的id，这样品牌表不就会产生重复的数据，后面会导致商品也可能会重复。

如果后面商品也重复了，就会带来非常多的问题。

因此，我们要在brand表做好控制，不应该区分大小写，保证品牌不会重复。

既然修改brand表的COLLATE这个方案不行，那么，只能修改业务逻辑了。

目前有两种解决方案：

前端搜索品牌时，不区分大小写。
前端品牌下拉控件，改成分页的，搜索品牌的功能，改成调用后端接口实现。

方案1适合品牌数据量少的情况。

方案2适合品牌数据量多的情况。

我们的品牌数据，其实在不断增加，因此，决定使用方案2。

后端提供一个分页查询品牌的接口，并且支持不区分大小写的模糊搜索功能。

但这样还不能100%保证，品牌数据在brand表中不会重复。

还需要给name字段增加唯一索引。

这样改造之后，后面用户输入yoyo，但数据库中有YOYO，在品牌下拉列表中会显示YOYO，用户可以直接选择使用。

这样对用户的交互更友好一些。

这是一类问题，可以衍生一下。

有些属性值表也有类似的问题。

比如用户自定义属性值之后，如果业务逻辑中有通过属性id查询属性值集合，再拿这个属性值集合跟自定义属性值做判断的时候，就需要忽略大小写做判断了。

其实，在我们的实际工作中，这样的场景很多，赶紧排查一下代码，看看你有没有这个问题？

大家如何对线上问题比较感兴趣，推荐订阅一下我的技术专栏《程序员最常见的100个问题》，目前已经更新了80多篇干货文章，里面收录了很多踩坑经历，对你的职业生涯或许有些帮助，最近收到的好评挺多的。

这个专栏总结了我10年工作中，遇到过的100个非常有代表性的技术问题，非常有参考和学习价值。

Java、Spring、分布式、高并发、数据库、海量数据、线上问题什么都有。

每篇文章从发现问题、分析问题、解决问题和问题总结等多个维度，深入浅出，分享了很多技术细节，定位和排查问题思路，解决问题技巧，以及实际工作经验。

你能从中学到很多有用知识，帮你少走很多弯路。

扫描下方二维码即可订阅：

原价199，现价只需23，即将涨价。

最后欢迎加入苏三的星球，你将获得：商城系统实战、秒杀系统实战、代码生成工具、系统设计、性能优化、技术选型、高频面试题、底层原理、Spring源码解读、工作经验分享、痛点问题等多个优质专栏。

还有1V1答疑、修改简历、职业规划、送书活动、技术交流。

目前星球已经更新了4400+篇优质内容，还在持续爆肝中..星球已经被官方推荐了3次，收到了小伙伴们的一致好评。戳我加入学习，已有1400+小伙伴加入学习。

http://mp.weixin.qq.com/s?__biz=MzkwNjMwMTgzMQ==&mid=2247522748&idx=1&sn=f757f1ef24dabf9910bfbab0ea223a6d

苏三说技术

作者曾浪迹几家大厂，掘金优秀创作者，CSDN万粉博主，免费刷题网站：www.susan.net.cn

最新文章

线程数突增！领导说再这么写就GC掉我！

神仙接私活神器，牛到不行，绝了！

千万级别的大表，性能优化的3招

为什么有HTTP协议，还要有websocket协议

大厂面试必考：Redis

聊聊 SPI 机制

瞧瞧别人家的Controller，那叫一个优雅

跌爆了。。。

突发，EasyExcel宣布停更了！