当前位置：首页 > news >正文

27 redis 的 sentinel 集群

news 2025/8/8 14:02:58

前言

redis 的哨兵的相关业务功能的实现

哨兵的主要作用是检测 redis 主从集群中的 master 是否挂掉, 单个哨兵节点识别 master 下线为主管下线, 超过 quorum 个哨兵节点认为 master 挂掉, 识别为客观下线

然后做 failover 的相关处理, 重新选举 master 节点

我们这里来看一下这里的整个流程

定时发送 ping, pub/sub ”Hello” 频道

sentinel 这边有单独的定时任务处理部分, 它存取数据, 只做监听集群中的数据节点, 哨兵节点的相关功能

定时发送 info, ping, 向 “__sentinel__:hello” 发布当前哨兵的相关信息[ip, port, id, epoch]

info 这边主要是向各个节点发送 info 命令, 然后哨兵节点这边定时更新数据节点的元数据信息

ping 这边主要是类似于一个集群心跳的功能

可以给根据 ping_period, PUBLISH_PERIOD 来更新发送的频率

向各个数据节点发送 PING 之后, 会记录 last_ping_time 等等信息

这里的 PING 就是一个心跳的功能

哨兵节点这边初始化的时候, 和 master 创建连接的时候, 会订阅 “__sentinel__:hello”

各个哨兵节点就是通过 “__sentinel__:hello” 来感知哨兵列表的

然后具体的哨兵节点的哨兵列表的维护就是在 sentinelReceiveHelloMessages 中进行处理的

哨兵节点认为 master 主观下线

就是上一次ping心跳到现在的时间超过了 down_after_period

或者 info心跳信息到现在的时间超过了 down_after_period+20s

调用堆栈信息如下

哨兵集群认为 master 客观下线

当认为 master 客观下线的哨兵节点数量超过了 quorum 个的时候, 哨兵集群认为 master 客观下线

调用堆栈信息如下

master 挂掉之后的重新选举和更新

主观下线之后, 选择哨兵 master 的流程

sentinelFailoverWaitStart 是选取哨兵 master 的处理

sentinelFailoverSelectSlave 是从数据节点中选择 master 的处理

sentinelFailoverSendSlaveOfNoOne 是切换 master 的处理

sentinelFailoverWaitStart 选取哨兵 master

sentinelGetLeader 是选择哨兵 master 的核心逻辑

哨兵master 才会往下面走下面的从 slave 节点中选择 master 的流程

选取哨兵 master 的相关处理

先统计其他哨兵的相关投标, 然后自己再进行投票选择票数最多的哨兵或者自己

然后投票之后, 再来选择票数最多的哨兵

最终筛选是否满足基础条件, 大于 (哨兵数量/2+1) 并且大于 master选举的数量

sentinelSelectSlave 选择新的 master 数据节点

处理方式如下, 筛选掉一部分的节点, 经过筛选的节点为备选列表, 然后还有具体的选择规则

筛选掉主观客观下线的节点

筛选掉失联的节点

筛选掉 ping 网络存在问题的节点

筛选掉配置 priority 为 0 的节点

筛选掉 info心跳超过一定时间的节点

筛选掉和 master 这边失联时间较长的节点, 说明它可能和集群沟通有问题

master 这边选择规则如下

优先级为 slave_priority, slave_repl_offset, runId 的比较

其中 slave_repl_offset 指代的是该 slave 节点和 master 这边同步的偏移, 偏移越大, 和 master 这边丢失的数据越少

就我们这里的场景, 挂掉了目前的 master 节点 redis_8002, 然后 redis_8001, redis_8003 的 slave_priority, slave_repl_offset 均相同, 然后就是根据 runId 进行选择了

然后上下文如下, 根据 runId 的规则, 选择了 redis_8003, 然后 redis_8003 成为了新的 master 节点

Master 信息的传播

其他的哨兵节点是通过 PUBLISH “__sentinel__:hello” 这边的业务处理来进行更新 master 的

然后从节点这边的 slaveOf 主从关系是哨兵节点这边向 slave 节点这边发送的信息

进而通知其他的 slave 节点, master 更新了, 需要全量或者增量重新同步数据了

完

查看全文

http://www.lryc.cn/news/265563.html

计算机网络网络安全技术

WebAssembly 的魅力：高效、安全、跨平台(下)

二维码智慧门牌管理系统升级：确保公安机关数据安全无忧

Golang leetcode59 螺旋矩阵

深度学习（Deep Learning）简介

服务器raid中磁盘损坏或下线造成阵列降级更换新硬盘重建方法

Ubuntu 常用命令之 exit 命令用法介绍

依托亚马逊云科技构建韧性应用

Prometheus-JVM

flink sql1.18.0连接SASL_PLAINTEXT认证的kafka3.3.1

pytorch张量的创建

Web自动化测试工具的优势分析

黑豹程序员-读properties属性文件本地正常，打包jar后运行出错

PyQt6 QTimer计时器控件

Vue：defineAsyncComponent(异步组件)、component(动态组件)、keep-alive(缓存组件)

14 款最佳文件恢复软件 [2024 年最佳精选工具]

Redis基础篇-004 Redis的Java客户端

【数据结构和算法】---栈和队列的互相实现

机场信息集成系统系列介绍（6）：机场协同决策支持系统ACDM

GO设计模式——17、解释器模式（行为型）

基于SSM的大学生兼职平台的设计与实现

Ignite内存配置

前端基础vue路由懒加载

C++系列第九篇数据类型下篇 - 复合类型（指针高级应用）

python三大开发框架django、 flask 和 fastapi 对比

html基础2

基于博弈树的开源五子棋AI教程[5 启发式搜索]

JavaScript原型，原型链 ? 有什么特点？

Unity 问题之 ScrollView ,LayoutGroup,ContentSizeFitter 一起使用时，动态变化时无法及时刷新更新适配界面的问题

linux 中 C++的环境搭建以及测试工具的简单介绍

前言