首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

使用查询分离后从20s优化到500ms

科技 2024-11-09 09:20 四川

大家好，我是苏三~

在前面一篇文章中提到过对于业务主表读写缓慢的解决方案：冷热分离，有不了解的请看：业务主表读写缓慢如何优化？

冷热分离固然是一个性价比高的解决方案，但也并不是银弹，仍然有诸多限制，比如：

查询冷数据慢
业务无法修改冷数据
冷数据多到一定程度系统依旧扛不住

此时如果需要解决以上问题，可以采用另外一种方案：使用查询分离优化业务主表数据大查询缓慢的问题

什么是查询分离？

查询分离从字面上来说非常容易理解，其实就是在写数据时保存一个备份数据到另外的存储系统，在查询时直接从另外的存储系统中获取数据，如下图：

查询分离

以上只是简单的架构图，其中有些细节还是需要深究，如下：

什么时候触发查询分离？
如何实现查询分离？
查询数据的存储系统选型？
查询数据如何使用？

查询分离的适用场景？

当你在实际业务中遇到以下情形，则可以考虑使用查询分离解决方案。

数据量大；
所有写数据的请求效率尚可；
查询数据的请求效率很低；
所有的数据任何时候都可能被修改；
业务希望我们优化查询数据的功能。

曾做过 SaaS 客服系统的架构优化，系统里有一个工单查询功能，工单表中存放了几千万条数据，且查询工单表数据时需要关联十几个子表，每个子表的数据也是超亿条。

面对如此庞大的数据量，跟前面的冷热分离一样，每次客户查询数据时几十秒才能返回结果，即便我们使用了索引、SQL 等数据库优化技巧，效果依然不明显。

工单表中有些数据是几年前的，客户说这些数据涉及诉讼问题，需要继续保持更新，因此我们无法将这些旧数据封存到别的地方，也就没法通过前面的冷热分离方案来解决。

最终我们采用了查询分离的解决方案，才得以将这个问题顺利解决：将更新的数据放在一个数据库里，而查询的数据放在另外一个系统里。因为数据的更新都是单表更新，不需要关联也没有外键，所以更新速度立马得到提升，每次客户查询数据时，500ms 内就可得到返回结果。

什么时候触发查询分离？

简单的来说就是什么时候应该保存一份数据到查询数据库中，其实也就是数据异构的过程，详细文章可以看我前面一篇文章：数据异构就该这样做，yyds~

这里介绍三种方式，如下：

同步建立
异步建立
binlog方式

1、同步建立

修改业务代码：在写入常规数据后，同步建立查询数据。

该种方案优缺点也非常明显：

优点：查询数据的一致性和实时性得到了保证

缺点：业务代码侵入比较强；减缓写操作的效率

2、异步建立

修改业务代码：写入数据后，异步建立查询数据

该种方案的优缺点如下：

优点：不影响主流程

缺点：数据一致性存在问题

3、 binlog的方式

该种方案也是业界常用的一种方案，对于代码是无侵入的，通过监听数据库日志的方式建立查询数据，如下：

该种方案的优缺点如下：

优点：不影响主流程；代码侵入为0

缺点：数据一致性存在问题；架构相对复杂

如何实现查询分离？

对于上述三种方案都算是比较常见的方案，对于第一种同步的方式比较简单，这里不再介绍；对于第三种binlog的方式在数据异构的文章中介绍过，详情见：数据异构就该这样做，yyds~

这篇文章来介绍一下异步的方式，异步的方式有很多，可以放在内存中进行操作，但是这有些弊端：

数据过多，内存有限
服务重启，内存数据将会丢失

因此最终我们可以选择MQ的方式，那么此时就涉及到了MQ的技术选型，这里给两个建议：

如果你的公司已经用了MQ，那么直接接着用即可
如果公司目前未引入MQ，则需要架构组考量选型了，对于MQ的选型可以看我之前文章：聊聊 MQ 技术选型

当然一旦引入了MQ还需要考虑的问题很多，如下：

1、 MQ突然宕机了怎么办？

MQ宕机意味着查询数据不能继续建立了，我们可以在写入数据的同时给该条数据加一个标志字段（已搬运、未搬运），当MQ启动后，查询所有未搬运的数据，继续建立查询数据

“
这里的方案很多，按照业务实际情况考量
”

2、消息的幂等消费

消息的幂等消费一定要保证，避免数据重复建立，比如：主数据的订单 A 更新后，我们在查询数据中插入了 A，可是此时系统出问题了，系统误以为查询数据没更新，又把订单 A 插入更新了一次。

3、消息的时序性问题

比如某个订单 A 更新了 1 次数据变成 A1，线程甲将 A1 的数据搬到查询数据中。不一会儿，后台订单 A 又更新了 1 次数据变成 A2，线程乙也启动工作，将 A2 的数据搬到查询数据中。

所谓的时序性就是如果线程甲启动比乙早，但搬运数据动作比线程乙还晚完成，就有可能出现查询数据最终变成过期的 A1

查询数据的存储系统选型？

既然为了解决表数据量大查询缓慢的问题，肯定是不能选用关系型数据库了，那么还有其他选择吗？

内存数据库虽然性能非常高，比如Redis，但是不适合海量数据，太费钱了

那么这里比较适用的有如下三种：

MongoDB
HBase
Elasticsearch

这里选型还是要根据自己公司业务选择，如果已经有在用的，则直接用即可；另外就是选择自己熟悉的，比如当初我们设计架构方案时，为什么选择用 Elasticsearch，除 ES 对查询的扩展性支持外，最关键的一点是我们团队对 Elasticsearch 很熟悉。

查询数据如何使用？

查询数据很简单，每个数据库都有对应的API，直接调用查询

但是，这里有一个问题：数据查询更新完前，查询数据不一致怎么办？，给出两种方案：

在查询数据更新到最新前，不允许用户查询。（我们没用过这种设计，但我确实见过市面上有这样的设计。）
给用户提示：您目前查询到的数据可能是 1 秒前的数据，如果发现数据不准确，可以尝试刷新一下，这种提示用户一般比较容易接受。

总结

本篇文章介绍了表数据量大查询缓慢的一种解决方案：查询分离，但这也不是银弹，仍然是存在一些不足，比如表数据量大，写入缓慢怎么办？这个后面文章再介绍吧

当然查询分离还有一个重要的问题：历史数据如何迁移？这个处理也是非常简单，但是也有许多需要考虑的点，后文介绍。

最后欢迎加入苏三的星球，你将获得：商城系统实战、秒杀系统实战、代码生成工具

、系统设计、性能优化、技术选型、高频面试题、底层原理、Spring源码解读、工

作经验分享、痛点问题等多个优质专栏。

还有1V1答疑、修改简历、职业规划、送书活动、技术交流。

目前星球已经更新了4400+篇优质内容，还在持续爆肝中..星球已经被官方推荐了3次，收到了小伙伴们的一致好评。戳我加入学习，已有1400+小伙伴加入学习。

我的技术专栏《程序员最常见的100个问题》，目前已经更新了80篇干货文章，里面收录了很多踩坑经历，对你的职业生涯或许有些帮助，最近收到的好评挺多的。

这个专栏总结了我10年工作中，遇到过的100个非常有代表性的技术问题，非常有参考和学习价值。

Java、Spring、分布式、高并发、数据库、海量数据、线上问题什么都有。

每篇文章从发现问题、分析问题、解决问题和问题总结等多个维度，深入浅出，分享了很多技术细节，定位和排查问题思路，解决问题技巧，以及实际工作经验。

你能从中学到很多有用知识，帮你少走很多弯路。

扫描下方二维码即可订阅：

原价199，现价只需23，即将涨价。

http://mp.weixin.qq.com/s?__biz=MzkwNjMwMTgzMQ==&mid=2247522789&idx=1&sn=072c9519f8ad12d7d54f7ea9613c5b16

苏三说技术

作者曾浪迹几家大厂，掘金优秀创作者，CSDN万粉博主，免费刷题网站：www.susan.net.cn

最新文章

线程数突增！领导说再这么写就GC掉我！

神仙接私活神器，牛到不行，绝了！

千万级别的大表，性能优化的3招

为什么有HTTP协议，还要有websocket协议

大厂面试必考：Redis

聊聊 SPI 机制

瞧瞧别人家的Controller，那叫一个优雅

跌爆了。。。

突发，EasyExcel宣布停更了！

使用查询分离后从20s优化到500ms

11月份跳槽的小伙伴必看

优雅的数据脱敏

JVM 如何调优？

明明表中没这条数据，竟然还能查出来？

阿里神器 Sentinel

裁员了，很严重，年底千万别离职

Java中的21种锁

OPPO 开奖了，心动了...

架构师必须懂这些。。。

RocketMQ出Bug了，消息疯狂堆积！

强烈建议尽快搞个软考证！（重大利好）

线程池原理

分页查询接口，从2s优化到了0.01s

上岸字节了

Redis 突然变慢了，如何排查？

瞧瞧别人家的异常处理，那叫一个优雅

又踩坑了。。。

OMG，数据库主从延迟了！！！

阿里神器 Seata

Spring 实现 3 种异步接口

离谱！一边在裁员，一边在高薪招人。

慢 SQL 打爆了监控！

前端要学这些。。。

Maven 还是 Gradle ?

比 MyBatis 快 100 倍的 ORM 框架

600条最强 Linux 命令总结（珍藏版）

MySQL 高性能规范

如何快速上手一个新项目？

大厂面试必考。。。

Seata 解决分布式事务，真香！

线上问题定位神器

用Guava 写出优雅代码

架构师必备技术。。。

幂等设计的8种实现方式

10个解放双手的在线工具

JDK23，带来了哪些新功能？

Java 语法糖，你用过几个？

最值得去的10家国企

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉