当前位置: 首页 > news >正文

使用 pypdf 快速切分 PDF 文件


categories: [Python]
tags: Python MacOS

写在前面

最近有小伙伴问我怎么把 PDF 文档切分成两个大小相近的 PDF文档, 要是在 mac 上, 直接无脑预览就行了, 但是这样不够跨平台, 之后我也尝试过 pymupdf, 但是奈何不支持 arm 架构, 后来还是用 Python 原生的 pypdf 了.

有 AI 加持还是很方便

方法 1:mac 预览

使用预览左边的缩略图栏就可以方便地切分(删除页面)然后保存了. 纯手工操作.

方法 2: pypdf

先安装

python -m pip install pypdf

pypdf 和 PyPDF2 以及 PyPDF3 都是如出一辙, 但是后来 PyPDF2 合并到了 pypdf, 所以用 pypdf 即可.

上代码

#!/opt/homebrew/Caskroom/miniforge/base/envs/py3x/bin/python
import pypdf
import sysdef split_and_save(filename, split_num):pdf = pypdf.PdfReader(filename)pdf1 = pypdf.PdfWriter()pdf2 = pypdf.PdfWriter()page_count = len(pdf.pages)for i in range(split_num):pdf1.add_page(pdf.pages[i])for i in range(split_num, page_count):pdf2.add_page(pdf.pages[i])# save output pdf on current pathpdf1.write(f'{filename[:-4]}-part1.pdf')pdf2.write(f'{filename[:-4]}-part2.pdf')if __name__ == "__main__":if len(sys.argv) != 3:print("Usage: split-pdf.py <filename> <split_page_num>")exit(-1)filename = sys.argv[1]split_num = int(sys.argv[2])split_and_save(filename, split_num)

API还是很清晰的, 配合python 强大的表达力, 搞个 PDF 不在话下.

使用方法就是

python split.py input.pdf 10

参数是待切分 PDF 的文件名和从哪一页开始切分, 例如我传入参数是 10, 那就是前 10 页为一个新 PDF, 后面的是一个新的 PDF.

http://www.lryc.cn/news/323571.html

相关文章:

  • Avalonia(11.0.2)+.NET6 打包运行到银河麒麟V10桌面系统
  • Mac nvm install failed python: not found
  • C语言基础知识复习(考研)
  • Prometheus Grafana 配置仪表板
  • docker 哲学 - 网络桥接器、容器网络接口 、容器间的通信方式
  • Python 将HTML转为PDF、图片、XML、XPS格式
  • 排序算法记录(冒泡+快排+归并)
  • 简单聊聊如何更优雅地初始化对象:构造函数、Builder模式和静态工厂方法比较
  • 跳过mysql权限验证来修改密码-GPT纯享版
  • Vue3快速上手(十七)Vue3之状态管理Pinia
  • 时序预测 | Matlab实现BiTCN-GRU双向时间卷积神经网络结合门控循环单元时间序列预测
  • 学习笔记Day14:Linux下软件安装
  • 【CXL协议-事务层之CXL.io(3)】
  • 如何自己构建 Ollama 模型
  • 5.84 BCC工具之tcpretrans.py解读
  • 从0到1实现RPC | 03 重载方法和参数类型转换
  • Matlab之已知2点绘制长度可定义的射线
  • 虚拟机安装Linux系统,FinalShell远程连接Linux
  • MacOS Xcode 使用LLDB调试Qt的 QString
  • C/C++代码性能优化——编程实践
  • JVM—内存可见性
  • VScode手动安装vsix格式插件,提示安装插件与code版本不兼容问题
  • K8S Storage
  • Day54-nginx限速-访问日志-错误日志精讲
  • SQL经典面试题
  • Java基础知识总结(14)
  • MacOS - GCC 版本升级解决方案
  • 小程序绕过 sign 签名
  • 【Canvas与艺术】绘制动态太极图
  • Llama 2 模型