当前位置: 首页 > news >正文

Redis原理篇——哨兵机制

Redis原理篇——哨兵机制

    • 1.Redis哨兵
    • 2.哨兵工作原理
      • 2.1.哨兵作用
      • 2.2.状态监控
      • 2.3.选举leader
      • 2.4.failover

1.Redis哨兵

主从结构中master节点的作用非常重要,一旦故障就会导致集群不可用。那么有什么办法能保证主从集群的高可用性呢?

2.哨兵工作原理

Redis提供了哨兵(Sentinel)机制来监控主从集群监控状态,确保集群的高可用性。

2.1.哨兵作用

哨兵集群作用原理图:

在这里插入图片描述

哨兵的作用如下:

  • 状态监控Sentinel 会不断检查你的 masterslave 是否按预期工作
  • 故障恢复(failover):如果 master 故障,Sentinel 会将一个 slave 提升为 master 。当故障实例恢复后会成为 slave
  • 状态通知Sentinel 充当 Redis 客户端的服务发现来源,当集群发生 failover 时,会将最新集群信息推送给 Redis 的客户端

那么问题来了, Sentinel 怎么知道一个 Redis 节点是否宕机呢?

2.2.状态监控

官方文档:

High availability with Redis Sentinel

Sentinel 基于心跳机制监测服务状态,每隔1秒向集群的每个节点发送ping命令,并通过实例的响应结果来做出判断:

  • 主观下线(sdown):如果某sentinel节点发现某Redis节点未在规定时间响应,则认为该节点主观下线。
  • 客观下线(odown):若超过指定数量(通过 quorum 设置)的sentinel都认为该节点主观下线,则该节点客观下线。quorum值最好超过Sentinel节点数量的一半,Sentinel节点数量至少3台。

如图:

在这里插入图片描述
一旦发现master故障,sentinel需要在salve中选择一个作为新的master,选择依据是这样的:

  • 首先会判断 slave 节点与 master 节点断开时间长短,如果超过 down-after-milliseconds * 10 则会排除该slave节点
  • 然后判断 slave 节点的 slave-priority值,越小优先级越高,如果是 0 则永不参与选举(默认都是1)。
  • 如果 slave-prority 一样,则判断 slave 节点的 offset 值,越大说明数据越新,优先级越高
  • 最后是判断 slave 节点的 run_id 大小,越小优先级越高(通过 info server 可以查看 run_id )。

问题来了,当选出一个新的master后,该如何实现身份切换呢?
大概分为两步:

  • 在多个 sentinel 中选举一个 leader
  • leader 执行 failover

2.3.选举leader

首先,Sentinel 集群要选出一个执行 failoverSentinel 节点,可以成为 leader 。要成为 leader 要满足两个条件:

  • 最先获得超过半数的投票
  • 获得的投票数不小于 quorum
    sentinel 投票的原则有两条:
  • 优先投票给目前得票最多的
  • 如果目前没有任何节点的票,就投给自己
    比如有3个 sentinel 节点,s1s2s3 ,假如 s2 先投票:
  • 此时发现没有任何人在投票,那就投给自己。s2 得 1 票
  • 接着 s1s3 开始投票,发现目前 s2 票最多,于是也投给 s2s2 得 3 票
  • s2 称为 leader ,开始故障转移
    不难看出,谁先投票,谁就会称为 leader ,那什么时候会触发投票呢?
    答案是 第一个确认 master 客观下线的人会立刻发起投票,一定会成为 leader

OK,sentinel找到 leader 以后,该如何完成 failover 呢?

2.4.failover

我们举个例子,有一个集群,初始状态下 7001 为 master ,7002 和 7003 为 slave

在这里插入图片描述

假如 master 发生故障,slave1 当选。则故障转移的流程如下:

  1. sentinel 给备选的 slave1 节点发送 slaveof no one 命令,让该节点成为 master

在这里插入图片描述

  1. sentinel 给所有其它 slave 发送 slaveof 192.168.150.101 7002 命令,让这些节点成为新 master ,也就是 7002slave 节点,开始从新的 master 上同步数据。

在这里插入图片描述

  1. 最后,当故障节点恢复后会接收到哨兵信号,执行 slaveof 192.168.150.101 7002 命令,成为 slave

在这里插入图片描述

参考:

https://www.bilibili.com/video/BV1S142197x7?p=145&vd_source=f586bbf89de5904ba5a05a8c1d18f1c4

http://www.lryc.cn/news/368538.html

相关文章:

  • web前端的MySQL:跨领域之旅的探索与困惑
  • Postgresql源码(135)生成执行计划——Var的调整set_plan_references
  • Python魔法之旅专栏(导航)
  • Python第二语言(五、Python文件相关操作)
  • Vue3 组合式 API:依赖注入(四)
  • Vue如何引入ElementUI并使用
  • VS2019 QT无法打开 源 文件 “QTcpSocket“
  • 【Golang】Map 稳定有序遍历的实现与探索:保序遍历之道
  • 使用Nextjs学习(学习+项目完整版本)
  • KUKA机器人KRC5控制柜面板LED显示
  • 为什么选择Python作为AI开发语言
  • 【算法篇】求最长公共前缀JavaScript版本
  • 搭建RocketMQ主从异步集群
  • 最大子段和问题
  • Vue3中的常见组件通信之mitt
  • MySQL快速入门(极简)
  • CentOS7安装NVIDIA显卡驱动指引【笔记】
  • 【RabbitMQ】RabbitMQ配置与交换机学习
  • 常见排序算法,快排,希尔,归并,堆排
  • 语法的时态1——一般现在时(1)
  • JAVA:在IDEA引入本地jar包的方法并解决打包scope为system时发布无法打包进lib的方案
  • Hadoop3:MapReduce源码解读之Map阶段的CombineFileInputFormat切片机制(4)
  • GPT-4o:OpenAI的最新篇章与深度探索
  • OpenGauss数据库-5.数据更新
  • 【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 机场航班调度程序(100分) - 三语言AC题解(Python/Java/Cpp)
  • Spark作业运行异常慢的问题定位和分析思路
  • 音视频转为文字SuperVoiceToText
  • Python基础教程(九):Lambda 函数
  • docker从入门到精通
  • 介绍工厂模式