当前位置: 首页 > news >正文

Redis为什么快?

目录

  • Redis为什么快?
  • 渐进式ReHash
    • 全局哈希表
    • 渐进式ReHash
  • 缓存时间戳


Redis为什么快?

  • 纯内存访问;

  • 单线程避免上下文切换;

  • 渐进式ReHash、缓存时间戳;

前面两个都比较好理解,下面我们主要来说下 渐进式ReHash缓存时间戳


渐进式ReHash

全局哈希表

为了实现从键到值的快速访问,Redis使用了一个哈希表来保存所有的键值对。一个哈希表,其实就是一个数组,数组的每个元素称为一个哈希桶。所以,我们常说,一个哈希表是由多个哈希桶组成的,每个哈希桶中保存了键值对数据。
在这里插入图片描述
哈希桶中的 entry 元素中保存了 key 和 value 指针,分别指向了实际的键和值,这样一来,即使值是一个集合,也可通过 *value 指针被查找到。因为这个哈希表保存了所有的键值对,所以,我也把它称为全局哈希表。

哈希表最大的好处很明显,就是让我们可以用O(1)的时间复杂度来快速查找到键值对,我们需要计算键值的哈希值,就可以知道它所对应的哈希桶的位置,然后就可以访问相应的 entry 元素。

但当你往 Redis 中写入大量数据后,就可能发现操作有时候会突然变慢了,这其实是因为你忽略了一个潜在的风险点,那就是 哈希表的冲突问题ReHash可能带来的操作阻塞

当你往哈希表中写入更多数据时,哈希冲突时不可避免的问题。这里的哈希冲突,两个 key 的哈希值和哈希桶计算对应关系时,正好落在同一个哈希桶中。

Redis解决哈希冲突的方式,就是链式哈希,链式哈希也很容易理解,就是指同一个哈希桶中的多个元素用一个链表来保存,它们之间依次用指针连接。

当然如果这个数组一直不变,那么hash冲突会变很多,这个时候检索效率会大打折扣,所以Redis就需要把数组进行扩容(一般是扩大到原来的两倍),但是问题来了,扩容后每个hash桶的数据会分散到不同的位置,这里设计到元素的移动,必定会阻塞IO,所以这个ReHash过程会导致很多请求阻塞。


渐进式ReHash

为了避免这个问题,Redis 采用了渐进式 ReHash。

首先,Redis 默认使用了两个全局哈希表:哈希表1 和 哈希表2。一开始,当你刚插入数据时,默认使用哈希表1,此时的哈希表2并没有被分配空间。随着数据逐步增多,Redis开始执行 ReHash。

  1. 给哈希表2分配更大的空间,例如是当前哈希表1大小的两倍;
  2. 把哈希表1中的数据重新映射并拷贝到哈希表2中;
  3. 释放哈希表1的空间;

在上面的第二步涉及大量的数据拷贝,如果一次性把哈希表1中的数据都迁移完,会造成Redis线程阻塞,无法服务其他请求,此时,Redis就无法快速访问数据了。
请添加图片描述
在Redis开始执行 ReHash,Redis仍然正常处理客户端请求,但是要加入一个额外的处理:

  • 处理第一个请求时,把哈希表1中的第一个索引位置上的所有 entries 拷贝到哈希表2中;

  • 处理第二个请求时,把哈希表1中的第二个索引位置上的所有 entries 拷贝到哈希表2中;

  • 如此循环,直到把所有的索引位置的数据都拷贝到哈希表2中。

这样就巧妙的把一次性大量拷贝的开销,分摊到了多次处理请求的过程中,避免了耗时操作,保证了数据的快速访问

所以这里基本上也可以确保根据 key 找 value 的操作在O(1) 左右。

不过这里要注意,如果Redis中有海量的 key 值的话,这个ReHash过程会很长很长,虽然采用渐进式ReHash,但在ReHash的过程中还是会导致请求有不小的卡顿,并且像一些统计命令也会非常卡顿,比如keys按照Redis的配置每个实例能存储的最大的key的数量为2的32次方,即2.5亿,但是尽量把key的数量控制在千万以下,这样就可以避免ReHash导致的卡顿问题,如果数量确实比较多,建议采用分区hash存储。


缓存时间戳

我们平时使用系统时间戳时,常常是不假思索的使用 System.currentTimeInMillis 或者 time.time() 来获取系统的毫秒时间戳。Redis不能这样,因为每一次获取系统时间戳都是一次系统调用,系统调用相对来说是比较费时间的,作为单线程的Redis承受不起,所以它需要对时间进行缓存,由一个定时任务,每毫秒更新一次时间缓存,获取时间都是从缓存中直接拿



http://www.lryc.cn/news/91603.html

相关文章:

  • Zabbix从入门到精通以及案例实操系列
  • 水声声波频率如何划分?水声功率放大器可将频率放大到20MHz吗?
  • 网络攻防技术--论文阅读--《基于自动数据分割和注意力LSTM-CNN的准周期时间序列异常检测》
  • C++ 学习 ::【基础篇:08】:C++ 中 struct 结构体的认识【面试考点:C 与 C++ 中结构体的区别】
  • Electron开发:打包和发布 Electron 应用
  • 【每日一题Day222】LC1110删点成林 | dfs后序
  • [ChatGPT] 从 GPT-3.5 到 GPT-5 的进化之路 | ChatGPT和程序员 : 协作 or 取代
  • 6.4 GDP调试多进程程序
  • TDengine 时序数据的保留策略
  • Java-多线程解析1
  • PHP 判断用户当前坐标是否在电子围栏内
  • Java版本工程管理系统源码企业工程项目管理系统简介
  • 高速缓存(cache)的原理: 了解计算机架构与性能优化
  • 【Vue3+TS项目】硅谷甄选day04--顶部组件搭建+面包屑+路由鉴权
  • 某oa 11.10 未授权任意文件上传
  • Grounded Language-Image Pre-training(论文翻译)
  • 设计模式-行为型模式(模板方法、策略、观察者、迭代器、责任链、命令、状态、备忘录、访问者、中介者、解释器)
  • 全面探讨 Spring Boot 的自动装配机制
  • 河道水位监测:河道水位监测用什么设备
  • 嵌入式系统中u-boot和bootloader到底有什么区别
  • 实验14:20211030 1+X 中级实操考试(id:2498)
  • (字符串 ) 剑指 Offer 58 - II. 左旋转字符串 ——【Leetcode每日一题】
  • EPICS编程
  • 17:00面试,还没10分钟就出来了,问的实在是太...
  • docker都有那些工具,及工具面试题
  • LAMP网站应用架构
  • C++虚函数virtual(动态多态)(纯虚函数)
  • 【Java 接口】接口(Interface)的定义,implements关键字,接口实现方法案例
  • 解决Vmware上的kali找不到virtualbox上的靶机的问题
  • 查看MySQL服务器是否启用了SSL连接,并且查看ssl证书是否存在