当前位置: 首页 > news >正文

Hbase-热点问题(数据存储倾斜问题)

1. 危害

某一台regionserver消耗过多,承受过多的并发量,时间长机器性能下降,甚至宕机

 2. 解决

可以通过设计rowkey+预分区的方法解决

比如可以预分区120个,1月的数据存到1-10分区,每个月的数据存到10个分区,而这10个分区是归不同的regionserver管的,所以不会产生数据倾斜。

那怎么让1月的数据存到1-10分区呢?就需要对rowkey进行设计了,设计的规则如下:

rowkey设计三个原则:

  1. 唯一性:相当于主键
  2. 长度性:16k,不要过长
  3. 散列性:hash, 加盐 ,字符串反转
                    (rowkey.hashcode % 分区数)_rowkey
http://www.lryc.cn/news/113976.html

相关文章:

  • 一个基于Java线程池管理的开源框架Hippo4j实践
  • 源码解析Flink源节点数据读取是如何与checkpoint串行执行
  • 进阶:Docker容器管理工具——Docker-Compose使用
  • 策略模式(Strategy)
  • webpack基础知识十:与webpack类似的工具还有哪些?区别?
  • 分享kubernetes部署:基于Ansible自动安装kubernetes
  • 【Kubernetes部署篇】基于Ubuntu20.04操作系统搭建K8S1.23版本集群
  • c++--二叉树应用
  • 以太网DHCP协议(十)
  • 企业服务器器中了360后缀勒索病毒怎么解决,勒索病毒解密数据恢复
  • 详解Kafka分区机制原理|Kafka 系列 二
  • CSS学习记录(基础笔记)
  • Chatgpt AI newbing作画,文字生成图 BingImageCreator 二次开发,对接wxbot
  • PPT忘记密码如何解除?
  • 绘制曲线python
  • CentOs 8 常见问题处理
  • OpenAI将GPT-4设置为ChatGPT Plus付费用户的默认模型
  • textarea 标签如何创建多行文本输入框?
  • (15)Qt绘图(two)
  • 用队列实现栈——数据结构与算法
  • Python“牵手”1688商品详情页数据采集方法,1688API接口申请指南
  • 记录第一篇被”华为开发者联盟鸿蒙专区 “收录的文章
  • jenkins的cicd操作
  • 【C++】异常exception
  • 2023-08-06力扣今日三题
  • kubeasz在线安装K8S集群
  • Vue中实现Web端鼠标横向滑动和触控板滑动效果
  • hdu5-Touhou Red Red Blue(贪心)
  • 【LeetCode 75】第二十三题(2352)相等行列对
  • 【云原生】详细学习Docker-Swarm部署搭建和基本使用