当前位置：首页 > news >正文

GNU zlib 压缩与解压文件详细介绍

news 2025/9/18 11:56:53

GNU zlib 压缩与解压文件详细介绍

1.概述

zlib 模块为 GNU 项目的 zlib 压缩库中的许多函数提供了一个低级接口

2.使用内存数据压缩与解压

2.1.压缩与解压缩

使用 zlib 的最简单方法是将所有数据保存在内存中进行压缩或解压缩。

import zlib
import binasciioriginal_data = b'This is the original text.'
print('Original     :', len(original_data), original_data)compressed = zlib.compress(original_data)
print('Compressed   :', len(compressed),binascii.hexlify(compressed))decompressed = zlib.decompress(compressed)
print('Decompressed :', len(decompressed), decompressed)

运行结果

Original     : 26 b'This is the original text.'
Compressed   : 32 b'789c0bc9c82c5600a2928c5485fca2ccf4ccbcc41c8592d48a123d007f2f097e'
Decompressed : 26 b'This is the original text.'

2.2.压缩级别

zlib 支持几种不同的压缩级别，允许在计算时间成本和空间成本之间取得平衡。
默认压缩级别 zlib.Z_DEFAULT_COMPRESSION 对应于性能和压缩结果之间折中的硬编码值，这当前对应于级别 6

如该示例所示，对于给定输入，可以使用多个压缩级别来实现相同的尺寸减小。

import zlibinput_data = b'Some repeated text.\n' * 1024
template = '{:>5}  {:>5}'print(template.format('Level', 'Size'))
print(template.format('-----', '----'))for i in range(0, 10):data = zlib.compress(input_data, i)print(template.format(i, len(data)))

运行结果

python3 zlib_compresslevel.pyLevel   Size
-----   ----0  204911    1722    1723    1724     985     986     987     988     989     98

2.3.增量压缩和解压缩

内存的存储是有限的，对大文件进行压缩和解压操作时，系统需要足够的内存来同时保存驻留在内存中的未压缩和压缩内容，这个不太现实。因此我们选择增量压缩，使用 Compress 和 Decompress 对象来逐步操作数据，这样整个数据集就不必全部纳入内存。

import zlib
import binasciicompressor = zlib.compressobj(1)with open('lorem.txt', 'rb') as input:while True:block = input.read(64)if not block:breakcompressed = compressor.compress(block)if compressed:print('Compressed: {}'.format(binascii.hexlify(compressed)))else:print('buffering...')remaining = compressor.flush()print('Flushed: {}'.format(binascii.hexlify(remaining)))

此示例从纯文本文件中读取小块数据并将其传递给 compress()。压缩器维护一个压缩数据的内部缓冲区。由于压缩算法取决于校验和和最小块大小，因此压缩器可能无法在每次接收到更多输入时返回数据。如果它没有准备好整个压缩块，则返回一个空字节字符串。当所有数据都被输入时，flush() 方法强制压缩器关闭最后一个块并返回其余的压缩数据

python3 zlib_incremental.pyCompressed: b'7801'
buffering...
buffering...
buffering...
buffering...
buffering...
Flushed: b'55904b6ac4400c44f73e451da0f129b20c2110c85e696b8c40dde
dd167ce1f7915025a087daa9ef4be8c07e4f21c38962e834b800647435fd3b90
747b2810eb9c4bbcc13ac123bded6e4bef1c91ee40d3c6580e3ff52aad2e8cb2
eb6062dad74a89ca904cbb0f2545e0db4b1f2e01955b8c511cb2ac08967d228a
f1447c8ec72e40c4c714116e60cdef171bb6c0feaa255dff1c507c2c4439ec96
05b7e0ba9fc54bae39355cb89fd6ebe5841d673c7b7bc68a46f575a312eebd22
0d4b32441bdc1b36ebf0aedef3d57ea4b26dd986dd39af57dfb05d32279de'

2.4.校验数据完整性

除了压缩和解压缩功能外，zlib 还包括两个用于计算数据校验和的函数，adler32() 和 crc32()。校验和都不是加密安全的，它们仅用于数据完整性验证。

import zlibdata = open('lorem.txt', 'rb').read()cksum = zlib.adler32(data)
print('Adler32: {:12d}'.format(cksum))
print('       : {:12d}'.format(zlib.adler32(data, cksum)))cksum = zlib.crc32(data)
print('CRC-32 : {:12d}'.format(cksum))
print('       : {:12d}'.format(zlib.crc32(data, cksum)))

两个函数都使用相同的参数，一个包含数据的字节字符串和一个可选值，用作校验和的起点。它们返回一个 32 位有符号整数值，该值也可以作为新的起始点参数在后续调用时传回，以生成 running 校验和。

python3 zlib_checksums.pyAdler32:   3542251998:    669447099
CRC-32 :   3038370516:   2870078631

查看全文

http://www.lryc.cn/news/9675.html

离线环境轻量级自动化部署

In-context Learning

【新2023】华为OD机试 - 最优调度策略（Python）

Python列表系列之统计计算

【蓝桥杯集训·每日一题】AcWing 1460. 我在哪？

一个不可忽视的重要能力

2023.2.6-2.12 AI行业周刊（第136期）：住院

听说2年以上的自动化测试都有16k+，4年10k的你还要等待奇迹吗？

git 命令实战

基于机器学习LSTM的古代汉语切分标注算法及语料库研究完整代码+数据+论文

魔百和M401A刷入Armbian系统EMMC开启wifi

超实用的小红书内容营销策略分享！纯干货

高压放大器在介电泳效应的细胞分选研究中的应用

Redis三高级篇-3. 最佳实践

基于 VPX 总线的工件台运动控制系统研究与开发-以光刻运动台为例（一）

回溯算法理论基础

【STM32笔记】低功耗模式下GPIO省电配置避坑实验（闲置引脚配置为模拟输入其实更耗电）

AI算法创新赛-人车目标检测竞赛总结02

Python 编程必备：盘点nginx和gunicorn的几大用法，建议收藏

USB3.0移动硬盘启动Win7的方法（AHCI/AMD USB3.0/Win7）

Python学习-----函数3.0（嵌套函数、闭包、装饰器）

最新版EasyRecovery数据恢复软件使用测评介绍

关于知识图谱TransR

始于日志，不止于日志，Elastic Stack全面介绍

FDX-B|EMID格式低频RFID 读卡模块LD6900技术选型与说明

《SQL基础》11. 索引

【前端】进阶Mac OS软件商城页面_缤纷多彩的创意UI

格创东智与金羽新能合作｜先进工业互联网助力固态电池智能化运营

软件测试面试刷题app包含了各种难题

19、ClickHouse企业中常见的20种用法

GNU zlib 压缩与解压文件详细介绍

1.概述

2.使用内存数据压缩与解压

2.1.压缩与解压缩

2.2.压缩级别

2.3.增量压缩和解压缩

2.4.校验数据完整性

相关文章：