当前位置: 首页 > news >正文

Redis中String数据结构为什么以长度44为embstr和raw实现的分界线?

​    一道常见Redis面试题。

​    在Redis的String数据结构中,当字符串的实际长度小于44且包含非整数字符时底层编码方式为embstr。当超过44时使用raw底层编码方式。

​    那么为什么要以字符串的长度44为分界线呢?

信息一

​    首先要分析embstr和raw编码格式的区别:首先Redis中所有的数据结构都是通过redisObject结构体描述的,其中的type字段标识了当前对象使用的数据结构(string、list、set等),encoding字段标识了当前对象采用的编码方式(ziplist、listpack、intset、skiplist等)。而embstr编码方式是为了提高cpu寻址效率在redisObject之后直接存储具体字符串的数据内容。而raw是在redisObject上通过维护一个指向堆上的内存空间存储具体的字符串内容。

信息二

​    内存分配器都是按照2^n进行分配的,同时cpu cache line最小访问单位为64个字节。因此为了实现cpu高效寻址,64个字节的内存空间是一个阈值。而Redis中操作对象的单位是通过redisObject。

分析如下

​    redisObject的数据结构如下:    

#define LRU_BITS 24
typedef struct redisObject {unsigned type:4;unsigned encoding:4;unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or* LFU data (least significant 8 bits frequency* and most significant 16 bits access time). */int refcount;void *ptr;
} robj;

​    type字段占用4个bit位,encoding占用4个bit位,LRU_BITS为24, lru字段占用24个bit位即3个字节。refcount字段占用4个字节。ptr字段在64位系统下,占用8个字节。加在一起 1 + 3 + 4 + 8 = 16个字节。即redisObject结构体中需要占用16个字节。

​    而ptr字段具体指向了实际的string编码结构对象,即sds。sds的结构有sds8、sds16、sds32、sds64。此时最大的寻址空间才为64个字节,因此选用最小的sds8即可。

​    sds8数据结构如下:

struct __attribute__ ((__packed__)) sdshdr8 {uint8_t len; /* used */uint8_t alloc; /* excluding the header and null terminator */unsigned char flags; /* 3 lsb of type, 5 unused bits */char buf[];
};

​    len字段和alloc字段为uint8_t,占用1个字节,flags占用1个字节。总计1 + 1 + 1 = 3个字节。

​    此时总计描述一个字符串信息需要使用的头信息占用16 + 3 = 19个字节。而string数据结构在设计上是兼容C语言字符串的。因此需要在末尾加上'\0'字符。还需要占用1个字节。此时总计19 + 1 = 20个字节。

​    64 - 20 = 44个字节。因此当字符串长度小于44个字节长度时,使用embstr编码类型可以极大提高redis的查询效率和存储效率。所以string数据结构使用字符串长度为44作为embstr和raw编码类型的分界线。

更多资料:0voice · GitHub

http://www.lryc.cn/news/613998.html

相关文章:

  • 【JavaEE】(10) JavaEE 简介
  • 多级缓存架构:新品咖啡上线引发的数据库压力风暴与高并发实战化解方案
  • Spring Boot Redis 缓存完全指南
  • 破解 Django N+1 查询困境:使用 select_related 与 prefetch_related 实践指南
  • sqlite的sql语法与技术架构研究
  • http请求响应
  • npm run 常见脚本
  • token过期为了保证安全,refresh token不过期,那么拿到refresh token就可以获取token,不还是不安全吗
  • C/C++与JavaScript的WebAssembly协作开发指南
  • 【科研绘图系列】R语言绘制气泡图
  • 【优选算法】多源BFS
  • CALL与 RET指令及C#抽象函数和虚函数执行过程解析
  • 【代码随想录day 14】 力扣 111.二叉树的最小深度
  • 集成电路学习:什么是URDF统一机器人描述格式
  • Spring MVC 父子容器深度解析:原理、实战与优化
  • Pytest项目_day09(skip、skipif跳过)
  • iOS 签名证书全流程详解,申请、管理与上架实战
  • 三方相机问题分析七:【datespace导致GPU异常】facebook 黑块和Instagram花图问题
  • 【性能测试】-2- JMeter工具的使用
  • 网吧在线选座系统|基于java和小程序的网吧在线选座小程序系统设计与实现(源码+数据库+文档)
  • 【Jmeter】设置线程组运行顺序的方法
  • Baumer相机如何通过YoloV8深度学习模型实现危险区域人员的实时检测识别(C#代码UI界面版)
  • 利用千眼狼sCMOS相机开展冷离子云成像与测量实验
  • 平板探测器的主要技术指标
  • Spring Boot 优雅配置InfluxDB3客户端指南:@Configuration + @Bean + yml实战
  • C# 异步编程(GUI程序中的异步操作)
  • 从浅拷贝到深拷贝:C++赋值运算符重载的核心技术
  • 【设计模式】抽象工厂模式 (工具(Kit)模式)
  • 【接口自动化】-2- request模块及通过变量实现接口关联
  • 瑞利杂波背景下不同环境的虚警概率与目标检测概率仿真