当前位置: 首页 > news >正文

Hbase要点简记

Hbase要点简记

  • Hbase
    • 1、底层架构
    • 2、表逻辑结构

Hbase

HBase是一个分布式的、列式的、实时查询的、非关系型数据库,可以处理PB级别的数据,吞吐量可以到的百万查询/每秒。主要应用于接口等实时数据应用需求,针对具体需求,设计高效率的数据查询接口。

1、底层架构

hbase底层架构
● Master:HBase 管理节点。管理 Region Server,分配 Region 到 Region Server,提供负载均衡能力;执行创建表等 DDL 操作。
● Region Server:HBase 数据节点。管理 Region,一个 Region Server 可包含多个 Region,Region 相当于表的分区。客户端可直接与 Region Server 通信,实现数据增删改查等 DML 操作。
● ZooKeeper:协调中心。负责 Master 选举,节点协调,存储 hbase:meta 等元数据。
● HDFS:底层存储系统。负责存储数据,Region 中的数据通过 HDFS 存储。

2、表逻辑结构

在这里插入图片描述
● RowKey(行键):行键是HBase记录条目的主键,物理存储时会按照RowKey的字典序排序存储,HBase基于RowKey实现索引;
● Column Family(列族):纵向切割,HBase中的每个列都归属于某个列族,列族不能改变,一行可有多个列族,一个列族可有任意个列;
● Column(列):一般都是从属于某个列族,跟列族不一样,这些列都可以动态添加。

注意:
● Key-Value(键值对):每一列存储的是一个键值对,Key是列名,Value是列值。通过{行键,列族名,列名}可以唯一确定一个列单元并获取数据Value,和关系型数据库不同的是,HBase中的数据是没有类型的,都是以bytes形式存储;
● Byte(数据类型):数据在HBase中以Byte存储,实际的数据类型交由用户转换;

如果HBase中的一张表只有一个列族的话,等于是这个列族包含了这张表的所有列,也就是将表整行的数据连续存储在了一起,就等于是行式存储了。如果一张表有多个列族,并且每个列族下仅有一列,也就是将表的列数据连续存储在了一起,就等于是列式存储了。

只有一个列族:
在这里插入图片描述
每个列族下仅有一列:
在这里插入图片描述

http://www.lryc.cn/news/454312.html

相关文章:

  • RabbitMQ的各类工作模式介绍
  • 李宏毅深度学习-图神经网络GNN
  • Redis篇(缓存机制 - 分布式缓存)(持续更新迭代)
  • python交互式命令时如何清除
  • Token,Cookie,Session,JWT详解
  • opencv-rust 系列: 1, 安装及运行自带示例和测试程序
  • Linux系统编程(一):Linux平台上静态库和动态库的制作与使用
  • Nginx的基础讲解之重写conf文件
  • RIFE: Real-Time Intermediate Flow Estimation for Video Frame Interpolation
  • rabbitMq-----broker服务器
  • MAC备忘录空白解决方案
  • cnn突破七(四层bpnet网络公式与卷积核bpnet公式相关)
  • PHP中的PEAR是什么
  • (C语言贪吃蛇)4.贪吃蛇地图优化及算法说明
  • 国外电商系统开发-运维系统拓扑布局
  • 使用winsock和ip相关指令重置Window网络配置
  • 用AI做电子萌宠,快速涨粉变现
  • 如何在 Axios 中封装事件中心EventEmitter
  • 计算机网络——ftp
  • Redis:set类型
  • 九大排序之插入排序
  • DNABERT: 一个基于 Transformer 双向编码器表征的预训练 DNA 语言模型
  • 基于Hive和Hadoop的电商消费分析系统
  • 记一次炉石传说记牌器 Crash 排查经历
  • 精益驱动的敏捷开发
  • SolidWorks机器转ROS2 URDF
  • (Linux驱动学习 - 6).Linux中断
  • SpringBoot驱动的明星周边产品电商解决方案
  • C++、Ruby和JavaScript
  • 32单片机 低功耗模式