当前位置: 首页 > news >正文

Python3进行pdf文件分割及转word

今天有个pdf分割的需求,电脑装的Python3,网上查资料都是Python2的代码,所以整理一份3的

安装:

 pip install PyPDF2 
import PyPDF2def funSplitPdf():pdf_file = open('/path/fileName.pdf', 'rb')pdf_reader = PyPDF2.PdfReader(pdf_file)size = len(pdf_reader.pages)for i in range(size):out_pdf = PyPDF2.PdfWriter()out_pdf.add_page(pdf_reader.pages[i])out_pdf_file = open('/path/fileName-'+str(i)+'.pdf','wb')out_pdf.write(out_pdf_file)out_pdf.close()
if __name__ == '__main__':funSplitPdf()

pdf转word

安装:

 pip install pdf2docx 
import pdf2docxdef funPdf2Word():pdf2docx.parse('/path/fileName.pdf','/path/fileName.docx')

pdf转png

安装:

pip install  PyMuPDF
import fitzdef funPdf2Png():pdf_file = fitz.open('/path/fileName.pdf')for i in range(pdf_file.page_count):pdf = pdf_file[i]zoom_x = 1.3  # 水平方向zoom_y = 1.3  # 垂直方向mat = fitz.Matrix(zoom_x, zoom_y)pix = pdf.get_pixmap(matrix=mat)pix._writeIMG('/path/fileName-'+str(i)+'.png', 1, 1)pdf_file.close()
http://www.lryc.cn/news/289716.html

相关文章:

  • 深入理解TCP网络协议(1)
  • QT 中如何使用 JSON 功能?
  • C++面试:算法的执行效率和资源消耗、时间和空间复杂度分析根据实际场景,选用合适的数据结构和算法进行程序设计
  • 力扣100215-按键变更的次数
  • STM32-GPIO输出(HAL库)
  • 倒计时80天
  • PBM模型参数详解
  • 贪吃蛇/链表实现(C/C++)
  • Qlik Sense : IntervalMatch(离散匹配)
  • MySql45讲-08.事务到底是隔离的还是不隔离的?(结合MVCC视频)
  • 备战蓝桥杯----数据结构及STL应用(基础2)
  • 日常学习之:vue + django + docker + heroku 对后端项目 / 前后端整体项目进行部署
  • LangGraph:一个基于LangChain构建的AI库,用于创建具有状态、多参与者的应用程序
  • 04-Nacos-服务注册基于spring boot实现
  • iOS 闭包和Block的区别
  • 后端学习笔记——后端细碎知识点(每天更新......)
  • 二进制中1的个数
  • python+matlab text(按图的相对位置显示)
  • rust 引用/mut 的所有权
  • 油烟净化器科技改革,清新用餐生活
  • [足式机器人]Part3 机构运动学与动力学分析与建模 Ch01-1 刚体系统的运动学约束
  • 51单片机智能小车
  • 9. 嵌入式系统开发:安全性与可靠性设计模式---引言
  • 内网安全:Exchange服务
  • Flask介绍和优势
  • 喜报|「云原生数据库PolarDB」、「阿里云瑶池一站式数据管理平台」揽获“2023技术卓越奖”
  • 【动态规划】【字符串】【行程码】1531. 压缩字符串
  • 检测头篇 | 原创自研 | YOLOv8 更换 SEResNeXtBottleneck 头 | 附详细结构图
  • PHP语法
  • MySQL:三大日志(binlog、redolog、undolog)