当前位置: 首页 > news >正文

Redis持久化-AOF

1.AOF

AOF(Append Only File)持久化:以独立日志的方式记录每次写命令,重启时在重新执行AOF文件中的命令达到恢复数据的目的。AOF的主要作用是解决了数据持久化的实时性,目前是已经是Redis持久化的主流方式。

有人就要问了:引入AOF之后,又要写内存,又要写硬盘,还能和之前一样快吗?

实际上影响是不大的,并没有影响到Redis处理请求的速度,原因在于:1.AOF机制并非是直接让工作线程把数据写入到硬盘,而是先写入到一个内存缓冲区,积累到一定的数量后,再统一写入到硬盘(这样大大降低了写硬盘的次数)。

2.硬盘上读写数据,顺序读写是比较快的(但是相对于内存写数据还是比较慢的),随机访问则是比较慢的。AOF每次把新的操作写入到原有文件的末尾,属于顺序读写。

2.AOF的使用

2.1使用AOF

开启AOF功能需要设置配置:appendonly yes,默认不开启。AOF文件名通过appendfilename配置(默认是appendonly.aof)设置。保存目录同RDB持久化方式一致,通过dir配置指定。AOF的工作流程操作:命令写入(append)文件同步(sync)文件重写(rewrite)重启加载(load)

2.2AOF工作流程

1.所有写入命令会追加到aof_buf(缓冲区)中

2.AOF缓冲区根据对应的策略向硬盘做同步操作

3.随着AOF文件越来越大,需要定期对AOF文件进行重写,达到压缩的目的。

4.当Redis服务器启动时,可以加载AOF文件数据恢复。

2.3命令写入

AOF命令写入的内容直接是文本协议格式,在AOF缓冲区会追加文本内容

Redis选择文本协议的可能原因:文本协议具有较好的兼容性,实现简单,具备可读性。

AOF过程中为什么需要aof_buf这个缓冲区?

AOF文件都直接同步硬盘,性能从内存的读写编程IO读写,必然会下降。先写入到缓冲区可以有效减少IO次数,同时,Redis还可以提供多种缓冲区同步策略,让用户根据自己的需求做出合理的平衡。

2.4文件同步

Redis提供了多种AOF缓冲区同步策略,由参数appendfsync控制。

AOF缓冲区同步文件策略

系统调用write和fsync说明:

write操作会触发延迟写机制(dalatyed write)机制。Linux在内核提供页缓冲区用来提供硬盘IO性能。write操作在写入系统缓冲区立即返回。同步硬盘操作依赖于系统调度机制,例如缓冲区页控件或达到特定时间周期。同步文件之前,如果此时系统故障宕机,缓冲区数据将丢失。

fsync针对单个文件操作,做强制硬盘同步,fsync将阻塞直到数据写入到硬盘中

1.配置为always时候,每次写入都要同步AOF文件,性能很差,在一般的STAT硬盘上,只能支持大约几百TPS写入。除非是非常重要的数据,否则不建议配置。

2.配置为no的时候,由于操作系统不同策略不可控,性能虽然提高了,但是数据丢失风险大增,除非数据重要程度很低,一般不建议配置。

3.配置为everysec(默认配置时),兼顾了数据安全和性能。理论上最多丢失1秒的数据

2.5重写机制

随着命令不断写入AOF,文件会越来越大,为了解决这个问题,Redis引入AOF重写机制压缩文件体积。AOF文件重写是把Redis进程内的数据转化为写命令同步到新的AOF文件

重写后的AOF文件为什么会变小?

这是因为AOF文件中有一些内容是冗余的,Redis启动过程中读取AOF文件的内容,记录了中间的过程,实际上Redis在重新启动时只关注最终结果。

冗余的内容:

1.进程内已经超时的数据不在写入到文件。2.旧的AOF中无效的命令,例如del,hdel,srem等重写后将会被删除,只需要保留数据的最终版本。3.多条操作合并为一条,例如lpush list a,lpush list b可以合并为一个lpush list a b  较小的AOF文件一方面减低了硬盘的空间占用,一方面可以提升提升启动Redis时数据恢复的速度。

AOF重写过程可以手动触发也可以自动触发:

手动触发:调用bgrewriteaof命令

自动触发:根据auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数确定自动触发时机。  auto-aof-rewrite-min-size:表示触发重写时AOF的最小文件大小,默认为64MB   auto-aof-rewrite-percentage:代表当前AOF占用大小相比较上次重写时增加的比例

AOF重写流程

1.执行AOF重写请求(bgrewriteaof)。如果当前进程正在执行AOF重写,请求不执行,直接返回。如果当前进程正在执行bgsave操作(生成RDB快照),重写命令延迟到bgsave完成之后再执行。

2.父进程执行fork创建子进程

3.重写

3.1主进程fork之后,继续响应其他命令。所有修改操作写入AOF缓冲区并根据appendfsync策略同步到硬盘上,保证旧AOF文件机制正确。3.2子进程只有fork之前的所有内存信息,父进程中需要将fork之后的这段时间的修改操作写入AOF的重写缓冲区中。

4.子进程根据内存快照,将命令合并到新的AOF文件中

5.子进程完成重写操作

5.1新文件写入后,子进程发送信号通知父进程  5.2父进程把AOF重写缓冲区临时保存的命令追加到新的AOF文件中。5.3用新的AOF文件代替旧的AOF文件。

2.6重启时数据恢复

当Redis启动时,会根据RDB和AOF文件的内容,进行数据恢复。

Redis根据持久化文件进行数据恢复

当Redis同时存在AOF文件和RDB快照,此时以AOF为主,RDB直接被忽略(这是因为AOF中包含的数据比RDB更全)。

3.Redis持久化回顾

1.Redis提供了两种持久化方案:RDB和AOF

2.RDB视为内存的快照,产生的内容更为紧凑,占用空间小,恢复速度快。但产生RDB的开销比较大,不适合实时持久化,一般用于冷备和主从复制。

3.AOF视为对修改命令的保存,在恢复时需要重放命令。并且有重写机制来定期压缩AOF文件

4.RDB和AOF都使用fork创建子进程,利用Linux子进程用于父进程内存快照的特点进行持久化,尽可能不影响煮即成继续处理后续命令。

http://www.lryc.cn/news/595921.html

相关文章:

  • Ubuntu 桌面版和服务器版在资源消耗上的对比分析
  • 第十六天(结构体初学)
  • Sa-Token大师:第四章 - 企业级架构与源码实战
  • Events
  • Linux部署.net Core 环境
  • 虚幻 5 与 3D 软件的协作:实时渲染,所见所得
  • linux-日志服务
  • 同步本地文件到服务器上的Docker容器
  • 跨维智能:全新一代人形机器人 DexForce W1 Pro
  • 大模型后训练——DPO实践
  • Mosaic数据增强介绍
  • 使用ubuntu:20.04和ubuntu:jammy构建secretflow环境
  • android模拟器手机打开本地网页
  • Tailwind CSS快速上手 Tailwind CSS的安装、配置、使用
  • J2EE模式---拦截过滤器模式
  • Vite:下一代前端构建工具的革命
  • C语言---VSCODE的C语言环境搭建
  • RISC-V基金会Datacenter SIG月会圆满举办,探讨RAS、PMU性能分析实践和经验
  • vs2017 c++ 使用sqlite3数据库
  • 末日期权的双买和单买策略区别是什么?
  • 双向链表详解及实现
  • C++_Hello算法_队列
  • 基于Java+MySQL实现(Web)文件共享管理系统(仿照百度文库)
  • 188粉福
  • Spring快速整合Mybatis
  • 技术与情感交织的一生 (十)
  • nodejs:告别全局安装,npx 命令详解及其与 npm 的区别
  • 从零开始学CTF(第二十五期)
  • Gitlab-CI实现组件自动推送
  • n8n - 为技术团队提供安全的自动化工作流