美团二面:说说redis主从的脑裂行为

科技 2024-10-16 17:11 江苏

前言

分享一道大厂面试真题：说说redis主从的脑裂？

我们可以按照这几个维度来回答：

什么是脑裂行为
主从集群中为什么会发生脑裂？
脑裂为什么又会导致数据丢失呢？
我们该如何避免和应对脑裂的发生呢？

1. 什么是脑裂

什么是脑裂行为?

脑裂（Split-Brain）是指在分布式系统中，网络分区导致多个节点之间失去联系，形成了两个或多个独立的“脑”，每个脑都认为自己是主节点，导致数据写入的冲突和不一致。

在 Redis 的主从架构中，如果主节点和从节点因网络故障或其他原因失去联系，哨兵开始选举了新的主节点，而旧的主节点恢复过来继续接受写请求，也就是存在两个redis主节点了，这就是redis的脑裂行为

2. 主从集群中为什么会发生脑裂？

脑裂行为在Redis主从集群中可能发生的原因，主要包括以下几点：

网络故障：在网络故障或不稳定的情况下，主节点与哨兵或从节点之间的通信可能会中断。这时，哨兵可能会误认为主节点已宕机。
哨兵的选举机制：当哨兵无法与主节点通信时，会启动选举过程，从现有的从节点中选出一个新的主节点。如果此时网络恢复，主节点仍在运行，就会导致出现两个主节点。
假故障: 哨兵的故障转移策略在网络异常时会过于敏感，容易在错误的情况下进行主节点的选举。也就是因为假故障导致又多选一个主节点出来。

3. 脑裂为什么又会导致数据丢失呢？

Redis的主从切换后，一旦从库被提升为新的主库，哨兵会指示原主库去执行主从复制命令，以便与新主库进行全量同步数据。最后在全量同步的阶段的话，原主库需要清除本地数据，加载来自新主库的RDB文件（我们知道，redis主从同步是基于rdb文件的）。这就会导致在主从切换期间，原主库接收的新写数据会丢失啦。

还是上个简单的图，方便大家理解吧：

上图，大家可以发现：

当旧的主库因为假死（假故障） 的原因，导致哨兵开始选举新的主库。在选举新主库期间，旧的主库莫名奇妙又好了，它可以继续接受写入的请求了。
然后新主库选好了，就有两个主库在同时处理写请求啦。等到新主库选好之后，旧的主库就变成从库了，它需要从新的主库那里同步数据过来，这样一来，在切换期间，旧主库保存的数据就丢失啦。

4. 我们该如何避免/应对脑裂的发生呢？

为了避免脑裂的发生，我们尝试这些方法：

使用 Quorum 配置：确保哨兵数量为奇数，并设定适当的投票规则，以减少误判的可能性。
合理设置超时参数：调整哨兵的 down-after-milliseconds 和 failover-timeout 参数，以适应实际网络环境，减少误判。
网络隔离与监控：确保网络稳定，监控网络状态和延迟，以便在问题出现时及时处理。
引入代理层：使用代理（如 Codis）来管理客户端与 Redis 的连接，避免直接连接导致的脑裂。

还有个比较推荐的方式，那就是min-slaves-to-write 和 min-slaves-max-lag 这两个参数，可以有效减少 Redis 脑裂的风险

min-slaves-to-write：该参数设置在执行写操作时，至少需要有多少个从节点在线并且处于同步状态。如果在线的从节点数量低于此值，主节点将拒绝写入请求，从而避免在不一致的情况下进行写操作。
min-slaves-max-lag：这个参数定义了允许的最大复制延迟（以秒为单位）。如果从节点的复制延迟超过此阈值，主节点将不会考虑这些从节点为有效，从而减少因落后节点引起的数据不一致问题。

往期推荐

4 种 MySQL 同步 ES 方案，yyds！

3个月面试近300人，发现大部分人回答不出来这道题的重点！

黑客为什么不攻击微信钱包？🧐

某些面试官在高贵什么啊！

淘宝网搞个 VsCode 、Excel 主题是几个意思，上班摸鱼刷淘宝？

业务单表读写缓慢如何优化？

这里有最新前沿技术资讯、技术干货等内容

点这里 ↓↓↓ 记得关注✔ 标星⭐ 哦

http://mp.weixin.qq.com/s?__biz=MzA5NjMwMDg0Ng==&mid=2455386934&idx=2&sn=975a82ee54413457e7b3ff0c1111e19b

码小辫

用堆栈的方式来学习技术，用遍历的方法来获取资料，用AI的思路考虑人生……码农的AI世界、BUG的程序员人生……hello world！

美团二面:说说redis主从的脑裂行为

阿里内部首发2024前端开发手册，完整版开放下载了！

3个月面试近300人，发现大部分人回答不出来这道题的重点！

黑客为什么不攻击微信钱包？🧐

山楂和它是「天仙配」，消食化滞、健运中焦，每天一杯，轻盈舒畅

节后开工接私活，赚爆！

某些面试官在高贵什么啊！

淘宝网搞个 VsCode 、Excel 主题是几个意思，上班摸鱼刷淘宝？

业务单表读写缓慢如何优化？

进字节了！46k*15薪！

网易云正在封号谨慎使用第三方客户端或脚本

某大厂员工：能力很强的同事被挤走了，留下的都是能力很差的同事，让人不明白！

专补大模型短板的RAG入门与实战书来了！

世界上运行时间最长的服务器是多久？

千年养肺古方，利咽润肺，1颗相当于10盅冰糖雪梨，嗓子舒服的就像做SPA！

中国人是不是很少用Linux？

Linux 磁盘空间异常爆满，该怎么查?

装一台电脑能赚 4 千，谁把电脑城干倒闭了？

仁和出品,手脚干裂、死皮老茧统统不见了

公司只有我和老板2个人，公司年纯利超100万元，我月薪税前5000元，老板几乎是甩手掌柜，我该抱怨吗？

京东二面：如何利用RocketMQ事务消息，来实现分布式事务？比如下单清空购物车的场景

为什么苹果不对12306购票抽成30%?

千元人体工学椅冲不动？这款百元不到的护腰正姿坐垫赢麻了~

90年代的硬盘已大规模变砖，存储数据时这样做很有必要

这才是批量update的正确姿势！

公司倒闭了，切实感受到互联网的寒气。。。

中国二十四节气里隐藏的健康智慧，到底有多厉害？

发现一个奇怪现象：国内大厂好像都没处理过退休流程？

为什么推荐大家优先使用 try-with-resources 而非 try-finally

开源软件的叛徒，加入了微软

随身携带，30秒充气！拯救颈枕，我只用这个神器！

入职一家不到20人的公司，一个月后我寄了..

指针是怎样一步步发明出来的？

月活能有8个亿，高德本事这么大了？

死磕六年，考据式漫改，《三体漫画》终于来了！

自己工资 14K，找到月薪 28K工作后，开心地提交辞呈，租了新房子！入职前一天HR说：原来岗位的人不走了，你offer被取消了

上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

取代后端岗，中国又一新兴岗位在崛起！这才是程序员未来5年最好的就业方向！

感觉自己在公司是薪资小偷。。

35岁被裁后，投200份简历已读不回。一气之下把薪资从1.5万改到3万，结果出乎意料

一键生成文案、画作、视频、课件、数字人？一本书玩转AIGC！

再见阿里，你好字节！

8种专坑同事 SQL 写法，性能降低100倍，不来坑一下？

运行了28年的装机王子Ghost，为什么不香了

为什么库存扣减不需要加锁？尤其是乐观锁？

各大厂裁员又降薪下，目前还在逆势扩招的行业出现了…大家冲一冲!

公司要双休了？不少员工强烈反对。。

强烈推荐一个“可捞偏门但不违法”的副业（50K+）

写出屎山代码的 12 个技巧，一定得会！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉