当前位置: 首页 > news >正文

postgres收缩工具两种工具的使用对比

postgres收缩工具安装和使用

第一章 需要使用插件处理膨胀的原因

Postgresql通过数据多版本实现MVCC,现象是删除数据并不会真正删除数据,而是修改标识,更新是通过删除+插入的方式进行,所以在频繁更新的OLTP系统,会造成数据膨胀。

PG数据库本身有处理膨胀问题的vacuum工具,该工具有三种类型,具体如下:

vacuum 表名字vacuum full 表名字autovacuum
不能回收空间可以回收空间
运行时可以正常访问数据表(共享锁)运行时不允许访问数据表(排他锁)
执行效率高执行效率低
作用是把表中的dead tuples进行删除标记变成可以使用的状态,并没有真正的物理删除,并且会更新统计信息和相关系统表作用是物理删除dead tuples,并且把释放的空间重新交给操作系统。 本质时生成一个新的数据文件,然后把原来的表的live tuples 存放到新的数据文件中只是个监控作用是用来启动自动清理进程的,autovacuum,autovacuum worker,vacuum+analyze

如果autovacuum清理速度赶不上dead元组产生速度,就会造成表膨胀。如表格所示,vacuum治标不治本,vacuum full会锁表,所以需要一种用最少的锁重新组织PG数据库中的表资源的工具,pg_repack或者pg_squeeze工具便可以实现

第二章:使用pg_repack

一 使用pg_repack的原理

1 总体思路:

新建一个文件,然后将老文件数据拷贝过来,然后进行文件切换,它不阻塞读写的秘诀就是新建文件和拷贝的过程是在线做的,在没有完成拷贝之前,原来的文件还是可以读写的,只有在切表那一瞬间有可能有影响。在线拷贝过程:源库的数据文件一直在变,所以表文件其实分为两部分,一部分是基础数据,一部分是增量数据,基础数据的拷贝就是正常的拷贝,增量数据是通过创建触发器来捕获在该表上的读写操作来实现的,待基础数据拷贝完后再将trigger捕获的增量sql进行应用,达到最终效果。

2 具体原理步骤如下:
对表执行全表repack:
  • 创建一个记录表,用于记录原表中的记录的修改

  • 在原表上创建一个触发器,记录插入、更新、和删除操作到日志表

  • 创建一个新表,包含原表中的所有的记录

  • 在新表上创建索引

  • 将日志表中的变更应用到新表

  • 使用system catalogs将原表和新表进行swap,包含索引和toast表

  • 删除原先的表

对索引执行repack
  • 使用concurrently创建新索引

  • 将新的索引和老的索引进行swap

  • 删除原先的索引

二 如何使用

1 安装
  • 下载安装包:

    https://pgxn.org/dist/pg_repack/

  • 解压缩并编译

cp pg_repack-1.4.8.zip /home/postgressu - rootunzip pg_repack-1.4.8.zipcd pg_repack-1.4.8makemake install
  • 创建拓展
psqlcreate extension pg_repack;
2 使用举例
postgres=# create table test(id int primary key,name varchar(255));
postgres=# insert into test select generate_series(1,50000000),'a';
postgres=# select * from pgstattuple('test');table_len | tuple_count | tuple_len | tuple_percent | dead_tuple_count | dead_tuple_len | dead_tuple_percent | free_space | free_percent 
-----------+-------------+-----------+---------------+------------------+----------------+--------------------+------------+--------------181239808 |     5000000 | 150000000 |         82.76 |                0 |              0 |                  0 |     620336 |         0.34
postgres=# \dt+ testList of relationsSchema |    Name     | Type  |  Owner   |  Size  | Description 
http://www.lryc.cn/news/418031.html

相关文章:

  • 仿真入门——CST软件如何设置分布式计算的共享储存
  • 【JVM基础17】——实践-说一下JVM调优工具
  • 【QT】Qt中Websocket的使用
  • 【vue3】【elementPlus】【国际化】
  • 用python实现求两个整数的最大公约数
  • Linux 内核源码分析---proc 文件系统
  • 视频号直播回放怎么下载?
  • 【第九节】python中xml解析和json编解码
  • yolo v8部署到云服务器问题记录
  • 端口被占用,杀死进程的步骤
  • 接口入门(企业常见使用,一分钟搞定版)
  • 深入解析:Cookie 与 Session 的区别及应用场景
  • LLM金融文本分类文档说明
  • EI检索,2天录用,3天见刊!截稿在即,这本水刊你还不投吗?
  • sql获取过去的小时数
  • 【Android Studio】彻底卸载
  • 美术版权可以当做商标使用吗
  • 控制某些请求不记录日志
  • Java线程池原理剖析和应用指南
  • ST-LINK烧录MCU
  • Go - 10. * 值类型和指针类型的差异
  • waf绕过:网络安全狗绕过
  • Django中的模型小总结:
  • 深入理解 RDMA 的软硬件交互机制
  • 轻优图片编辑压缩官网 轻优图片编辑压缩
  • 封装el-table 基于element封装可配置JSON表格组件
  • Springboot 开发之 Quartz 任务调度框架简介
  • 详解Xilinx FPGA高速串行收发器GTX/GTP(4)--TX/RX接口的数据位宽和时钟设计
  • idea个人常用快捷键设置
  • 超实用 不再担心猫咪掉毛 一文教你养宠家庭空气净化器怎么选