当前位置: 首页 > news >正文

一致性Hash问题及解决方案

Hash算法的应用场景

  1. 请求的负载均衡
    Nginx的ip_hash策略可以在客户端ip不发生变化的情况下,将其发出的请求始终路由到同一个目标服务器上,实现会话粘滞,避免处理session共享问题。
  • 如果没有ip_hash策略,可以通过维护一张映射表的方式来实现会话粘滞:
    • 映射表存储的是客户端ip或者session与具体目标服务器的映射关系 <ip,server>

      • 缺点:
        1. 客户端很多的情况下,映射表非常大,浪费内存空间
        2. 客户端上下线、目标服务器上下线都会导致重新维护映射表,维护成本大
    • 如果使用Hash算法,可以对ip或者session计算hash值,hash值与服务器数量进行取模运算,得到的值就是当前请求应该被路由到的服务器编号。由此,同一个ip发送过来的请求就可以路由到同一个目标服务器,实现会话粘滞。

  1. 分布式存储
    有 Redis1、Redis2、Redis3 三台Redis服务器,可以针对key进行hash处理 Hash(key)%3 = index 使用余数锁定存储的具体服务器节点。

普通Hash算法存在的问题

以ip_hash为例,假定用户ip固定不变,当后端服务器有一个宕机,数量由3变为2,那么之前所有用户的求模都需要重新计算。
如果在生产环境中,后台服务器有很多台,客户端也有很多个,出现这种问题的影响是很大的。服务器的扩缩容都会出现这样的问题,大量的用户请求被路由到其他的目标服务器处理,用户在原来服务器的会话都将丢失。

普通Hash算法:

// 定义客户端IP
String[] clients = {"192.168.31.121", "192.168.3.21", "192.168.1.11"};// 定义服务器数量
int server = 5;// hash(ip) % server数量 = index
for (String client : clients) {int hashCode = Math.abs(client.hashCode());int index = hashCode % server;System.out.println("客户端:\t" + client + "\t 分配到了服务器 " + (index + 1) + " 上");
}

一致性Hash算法的思路

  1. 首先有一条直线,直线开头和结尾分别定为1和232-1,这相当于一个地址
  2. 对于这样一条直线,首尾相连构成一个闭环,这样的圆环称为Hash环
  3. 把服务器IP或者主机名求Hash值然后对应到Hash环上,针对客户端IP求Hash值,对应到环上的某个位置,然后按照顺时针的方向找最近的服务器节点

在这里插入图片描述

  • 缩容
    假设将节点3下线,原来路由到3的客户端请求重新路由到节点4,对于其他客户端没有影响,只是这一小部分受到影响
    请求的迁移量达到了最小,这样的算法对于分布式集群来说非常合适,避免了大量请求转移。

在这里插入图片描述

  • 扩容
    新增节点5之后,原来路由到节点3的部分客户端路由到了节点5上,对于其他客户端没有影响,只是这一小部分受到影响

在这里插入图片描述

代码如下:

// 定义服务器IP
String[] servers = {"192.168.31.121", "192.168.3.21", "192.168.1.11", "12.168.31.121", "192.138.3.21", "192.68.1.11"};
// 定义客户端IP
String[] clients = {"12.16.31.121", "12.18.3.1", "19.16.1.11"};
// 计算服务器的Hash,并放到排序的Map中
SortedMap<Integer,String> hashServerMap = new TreeMap<>();
for (String server : servers) {int hashCode = Math.abs(server.hashCode());hashServerMap.put(hashCode,server);
}
// 求客户端IP的Hash,取出对应的服务器
for (String client : clients) {int clientHash = Math.abs(client.hashCode());SortedMap<Integer, String> tailedMap = hashServerMap.tailMap(clientHash);// 取出Hash环上的第一台服务器Integer firstKey;if (tailedMap.isEmpty()){firstKey = hashServerMap.firstKey();}else {firstKey = tailedMap.firstKey();}System.out.println("客户端IP\t"+ client +"\t被路由到了服务器\t" + hashServerMap.get(firstKey));
}

存在的问题及解决方法

如上所述,每一台服务器负责一段,一致性Hash算法对于节点的增加都只需要重定位环空间的一小部分数据,具有较好的容错性和可扩展性。

  1. 一致性Hash算法在服务节点太少时,容易因节点分部不均匀造成数据倾斜问题。例如只有两台服务器,这两台服务器在环上的分部十分靠近,导致某个节点只负责非常小的一段,大量的请求落在了另外一个节点上,导致数据倾斜。
  2. 为了解决这种方法,一致性Hash算法引入了虚拟节点机制,即对每一个服务节点计算多个Hash,每个计算结果都放置一个此服务节点,称为虚拟节点。具体做法可以在服务器IP或者主机名后增加编号来实现,例如 “节点1的ip#1” “节点1的ip#2” “节点1的ip#3”……形成多个虚拟节点,当客户端被路由到虚拟节点的时候其实是被路由到该虚拟节点所对应的真实节点。

代码如下:

// 定义服务器IP
String[] servers = {"192.168.31.121", "192.168.3.21", "192.168.1.11", "12.168.31.121", "192.138.3.21", "192.68.1.11"};
// 定义客户端IP
String[] clients = {"12.16.31.121", "12.18.3.1", "19.16.1.11"};SortedMap<Integer, String> serverHash = new TreeMap<>();int virtualNodeCount = 3;
// 开始计算服务器的Hash
for (String server : servers) {int hash = Math.abs(server.hashCode());serverHash.put(hash, server);// 设置虚拟节点for (int i = 0; i < virtualNodeCount; i++) {int virtualNodeHash = Math.abs((server + "#" + i).hashCode());serverHash.put(virtualNodeHash, "虚拟节点" + i + "映射过来的请求:" + server);}
}System.out.println(serverHash.size());
// 计算客户端请求的服务器Hash
for (String client : clients) {int clientHash = Math.abs(client.hashCode());SortedMap<Integer, String> tailedMap = serverHash.tailMap(clientHash);if (tailedMap.isEmpty()) {Integer firstKey = serverHash.firstKey();System.out.println("客户端:" + client + "\t\t路由到了 \t" + serverHash.get(firstKey));} else {Integer firstKey = tailedMap.firstKey();System.out.println("客户端:" + client + "\t\t路由到了 \t" + serverHash.get(firstKey));}
}
http://www.lryc.cn/news/397810.html

相关文章:

  • 【接口设计】如何设计统一 RESTful 风格的数据接口
  • 【备战秋招】——算法题目训练和总结day3
  • Git 操作总结
  • 若依 ruoyi-vue SpringBoot highlight-textarea 输入框敏感词关键词高亮标红(二)
  • 33 IRF配置思路
  • Dify中的RAG和知识库
  • vue3 + i18n 中英文切换
  • one-hot-zhu案例
  • 数据库课设---酒店管理系统(MySQL、VBNet)
  • NLP入门——前馈词袋分类模型的搭建、训练与预测
  • GD32F303RET6读取SGM58031电压值
  • Pandas实战指南:any()函数深度解析与高效应用
  • ClickHouse中PRIMARY KEY和ORDER BY关键字的关系
  • android 图片轮播
  • 进度条提示-在python程序中使用避免我误以为挂掉了
  • 【案例】python集成OCR识别工具调研
  • 第一关:Linux基础知识
  • qt 自定义信号和槽举例
  • 编程语言与数据结构的关系:深度解析与探索
  • 了解AsyncRotationController
  • 有必要找第三方软件测评公司吗?如何选择靠谱软件测评机构?
  • 物联网系统中市电电量计量方案(一)
  • 2024年热门无线领夹麦克风哪款好,麦克风品牌排行榜前十名推荐
  • IEEE顶刊“放水”?稳居1区Top,发文扩张IF稳长,CCF推荐,审稿友好!
  • 发布:PhonePrompter_PC(手机录视频提词器_电脑版)
  • shein测试开发会问些啥?
  • mysql索引优化
  • Linux文件编程(打开/创建写入读取移动光标)
  • 集成测试技术栈
  • MongoDB - 集合和文档的增删改查操作