当前位置: 首页 > news >正文

【python实用小脚本-190】Python一键删除PDF任意页:输入页码秒出干净文件——再也不用在线裁剪排队

Python一键删除PDF任意页:输入页码秒出干净文件——再也不用在线裁剪排队

PDF删页, 零依赖脚本, 命令行秒用, 小白神器, 瑞士军刀

故事开场:一把瑞士军刀救了你

周一早高峰,老板发来 200 页 PDF:
“把第 18、25、37 页删掉,10 分钟后开会!”
你打开浏览器找在线工具——排队 20 人,上传 80 MB,还提示“会员专享”。
这时,你从 U 盘掏出“小白瑞士军刀”——main.py
双击运行,按提示输入:

What is the file that you would like to modify?
>>> report.pdf
How many pages do you need to delete?
>>> 3
Enter the page numbers…
>>> 18 25 37

30 秒后,output.pdf 躺在桌面,只剩 197 页。
老板惊呼:“效率真高!”
痛点解决:再也不用在线排队、上传下载,本地 30 秒搞定。


完整代码(≤1000字符,直接展示)

from PyPDF2 import PdfFileWriter, PdfFileReaderprint("请输入要处理的 PDF 路径:")
file = input()
pdf_in = PdfFileReader(file)print("要删除几页?")
n = int(input())
pages_to_delete = []
print("请输入页码(每行一个):")
for _ in range(n):pages_to_delete.append(int(input()) - 1)  # 页码从 0 开始pdf_out = PdfFileWriter()
for i in range(pdf_in.getNumPages()):if i not in pages_to_delete:pdf_out.addPage(pdf_in.getPage(i))with open('output.pdf', 'wb') as f:pdf_out.write(f)
print("完成!已生成 output.pdf")

代码解析

功能块 1:读取 PDF

PdfFileReader 把整本 PDF 加载到内存,后续操作零延迟。

pdf_in = PdfFileReader(file)

功能块 2:交互收集页码

input() 逐行收集用户想删的页码,减 1 转成 0 基索引,小白不会输错。

pages_to_delete.append(int(input()) - 1)

功能块 3:循环保留页面

遍历所有页码,不在删除列表就加入新 PDF,顺序不变。

for i in range(pdf_in.getNumPages()):if i not in pages_to_delete:pdf_out.addPage(pdf_in.getPage(i))

如果还想更厉害

扩展点子 1:命令行参数

-f report.pdf -p 18 25 37 -o cleaned.pdf,一行搞定。

import argparse
parser = argparse.ArgumentParser()
parser.add_argument('-f', '--file', required=True)
parser.add_argument('-p', '--pages', nargs='+', type=int)
parser.add_argument('-o', '--output', default='output.pdf')
args = parser.parse_args()

扩展点子 2:图形界面

tkinter 拖文件选页码,按钮一键删除。

import tkinter.filedialog as fd
file = fd.askopenfilename(filetypes=[("PDF", "*.pdf")])
# 复用上面页码列表逻辑

总结

main.py 这把 20 行瑞士军刀,把“上传→排队→下载”三步压缩成“输入页码+回车”。
你无需安装任何大型软件,就能把 PDF 任意页秒删,顺序不乱。
再加两行参数或 GUI,它就从脚本升级成批量神器。
下次再遇“删两页”需求,直接跑脚本,30 秒收工!

源码获取

完整代码已开源,包含详细的注释文档:
🔗 [GitCode仓库] https://gitcode.com/laonong-1024/python-automation-scripts
📥 [备用下载] https://pan.quark.cn/s/654cf649e5a6 提取码:f5VG

http://www.lryc.cn/news/625633.html

相关文章:

  • 《WASM驱动本地PDF与Excel预览组件的深度实践》
  • LeetCode 100 -- Day2
  • Leetcode 3654. Minimum Sum After Divisible Sum Deletions
  • C++小游戏NO.1游戏机
  • 【GNSS定位原理及算法杂记5】​​​​PPK(后处理动态定位)深度解析:后处理的艺术与 RTK 的互补
  • 【HarmonyOS】H5 实现在浏览器中正常跳转 AppLinking 至应用
  • HarmonyOS 中的 setInterval的基本使用
  • Android Coil 3拦截器Interceptor计算单次请求耗时,Kotlin
  • 进程通信:进程池的实现
  • Java 大视界 -- Java 大数据在智能物流无人配送车路径规划与协同调度中的应用
  • 【什么是非晶合金?非晶电机有什么优点?】
  • k8sday11服务发现(2/2)
  • Kubernetes 的 YAML 配置文件-kind
  • 在 Kotlin 中 使用泛型类和泛型函数
  • WRC大会精彩回顾 | NanoLoong机器人足球首秀青龙机械臂咖啡服务双线出击
  • 【论文阅读】DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries
  • 【新启航】航空飞机起落架深孔型腔的内轮廓检测方法探究 - 激光频率梳 3D 轮廓检测
  • 主流 3D 模型格式(FBX/OBJ/DAE/GLTF)材质支持与转换操作指南
  • STranslate:一键聚合翻译+OCR,效率翻倍
  • CVPR 2025 | 具身智能 | HOLODECK:一句话召唤3D世界,智能体的“元宇宙练功房”来了
  • Chrome原生工具网页长截图方法
  • [Linux] 网络中的 `tun` 模式
  • 神经网络拆解:用Excel模拟手写数字识别
  • Chrome 插件开发实战技术文章大纲
  • 从密度到聚类:DBSCAN算法的第一性原理解析
  • 【数据可视化-93】使用 Pyecharts 绘制旭日图:步骤与数据组织形式
  • 从接口自动化测试框架设计到开发(三)主流程封装、返回数据写入excel
  • 传统艾灸VS七彩喜艾灸机器人:同样的艾香,多了4分“巧”
  • JetBrains系列产品-IDEA/PyCharm/GoLand自动生成方法返回值的快捷键,查看方法参数的快捷键。
  • 0819 使用IP多路复用实现TCP并发服务器