当前位置: 首页 > news >正文

Hbase-面试题

1. Hbase-region切分 

  1. 自动切分,默认情况下
    1. 2.0版本,第一次region的数据达到256M,会进行切分,以后就是每达到10G切分一次,切分完成后,会进行负载均衡,均衡到其他regionserver
  2. 预分区+自定义rowkey
    1. 可以理解为预切分
    2. 比如预分区,每个regionserver会有10个region,每个region都有startrow和endrow
    3. 生产上必须要用预分区+自定义rowkey
    4. 预分区好了之后,即使没有数据,也会新建10个region的空文件
    5. 以后存数据的时候,会均匀的存到每个region中

2. Hbase-大合并和小合并

大合并:将过期数据删除,将文件进行合并  企业中7天进行一次
小合并:将过期数据标记,但是不会删除,只会合并邻近的文件 

3. Hbase-内存数据刷写

  1. 手动刷写
    1. 用命令刷写
  2. 定时刷写
  3. 设置参数
    1. MemStore达到128M
    2. 如果MemStore比较多,而且都没有达到128M,可以设置region的大小为512M

 4. Hbase-二级索引

 4.1. 问题

hbase查询如果过滤条件不是rowkey,就会全局遍历  

举例:

如果根据name过滤,就会全局遍历

id    name    age  
1     ikun    19   

4.2. 解决

添加二级索引,其实就是再新建一个表,以name为rowkey

name  id  
ikun  1 

http://www.lryc.cn/news/115274.html

相关文章:

  • 图的宽度优先深度优先遍历
  • redis Set类型命令
  • Netty框架自带类DefaultEventExecutorGroup的作用,用来做业务的并发
  • TCP的四次挥手与TCP状态转换
  • 【网络编程】实现一个简单多线程版本TCP服务器(附源码)
  • centos离线部署docker
  • ffmpeg使用滤镜对视频进行处理播放
  • Ansible Handlers模块详解,深入理解Ansible Handlers 自动化中的关键组件
  • threejs点击模型实现模型边缘高亮的选中效果--更改后提高帧率
  • RocketMQ 主备自动切换模式部署
  • 【MySQL】select相关
  • 在Python中应用RSA算法实现图像加密:基于Jupyter环境的详细步骤和示例代码
  • Prometheus Blackbox Exporter 的 HTTP 探测指标中各个阶段的时间统计信息
  • 数据结构之时间复杂度-空间复杂度
  • 新一代构建工具 maven-mvnd
  • 构建Docker容器监控系统(2)(Cadvisor +Prometheus+Grafana)
  • Leetcode.995 K 连续位的最小翻转次数
  • PHP8的跳转语句-PHP8知识详解
  • Idea中maven无法下载源码
  • 【linux-keepalive】keepalive避免单点故障,高可用配置
  • 测试网络模型的FLOPs和params
  • 《树莓派项目实战》第十五节 使用L298N驱动板模块驱动双极42步进电机
  • 基于短信宝API零代码实现短信自动化业务
  • Qt应用开发(基础篇)——信号槽 Signals and Slots
  • 正则表达式--Notepad++常用的替换
  • ES6 对象合并
  • 使用线性回归预测票房收入 -- 机器学习项目基础篇(10)
  • 一文读懂|RDMA原理
  • 深入理解负载均衡原理及算法
  • 44.实现爱尔兰B公式计算并输出表格(matlab程序)