当前位置: 首页 > news >正文

Python-基于PyQt5,pdf2docx,pathlib的PDF转Word工具(专业版)

前言:日常生活中,我们常常会跟WPS Office打交道。作表格,写报告,写PPT......可以说,我们的生活已经离不开WPS Office了。与此同时,我们在这个过程中也会遇到各种各样的技术阻碍,例如部分软件的PDF转Word需要收取额外费用等。那么,可不可以自己开发一个小工具来实现PDF转Word这个功能呢?答案是肯定的,Python生来就是为应用层开发的。话不多说,我们直接开始今天的Python学习之路-利用Python编写一个基于PyQt5,pdf2docx,pathlib,sys,os,datetimePDF转Word工具。

 编程思路:本次编程我们将会调用到PyQt5,pdf2docx,pathlib,datetime,sys,os等库。其中,PyQt5提供了图形用户交互界面,线程池,信号槽等槽点。pdf2docx则负责将PDF文档转换为Word文档。pathlib获取生成的Word文档的绝对路径,并保证Word文档存放在系统的指定位置。datetime库用来获取系统当前的时间参数,并将其以时间戳的形式给生成的Word文档命名,这对用户后面方便搜索和查询文件详细信息非常重要。sys使我们与Python解释器(PyCharm)进行交互、以及控制程序的执行成为了可能。本次编程中,os库被用于启动文件浏览器(os.startfile),以便我们选择要转换的 PDF 文件。具体来说,我们可以用它在 Windows 系统上打开所想要转换的PDF的所在文件或目录。本次,我们还会将gif动画导入GUI界面,让用户的体验感更好。

第一步:导入库

标准库:pathlib,sys,os,datetime。

第三方库:PyQt5,pdf2docx。

# 导入库
import sys
import os
from PyQt5.QtWidgets import *
from PyQt5.QtCore import Qt, QThread, pyqtSignal
from PyQt5.QtGui import QMovie  # 导入QMovie类
from pdf2docx import Converter
from pathlib import Path
from datetime import datetime

 

第二步:建立功能类

这一步中我们需要建立两个类:1,线程进度类  2,转换窗口类。

线程进度类:负责PDF文档从PDF格式转换为Word格式的目录创建,格式转换,新文件生成等步骤的执行。

转换窗口类:负责PDF文档转Word文档过程中GUI各控件(按钮,主窗口,进度条,信息框等)的布局。

本次我们将动态进度条改为了固定的文字显示,以免用户被系统报错而停滞的进度条误导。

# 线程进度类
class ConversionThread(QThread):progress_updated = pyqtSignal(str)  # 修改为仅传递描述信息conversion_finished = pyqtSignal(bool, str)# 线程初始化def __init__(self, pdf_path, output_dir):super().__init__()self.pdf_path = pdf_pathself.output_dir = output_dirself.docx_path = ""def run(self):try:# 创建输出目录output_path = Path(self.output_dir)output_path.mkdir(parents=True, exist_ok=True)# 生成带时间戳的文件名timestamp = datetime.now().strftime("%Y%m%d%H%M%S")original_name = Path(self.pdf_path).stemself.docx_path = str(output_path / f"{original_name}_{timestamp}.docx")# 初始化转换器cv = Converter(self.pdf_path)# 获取总页数用于进度计算total_pages = len(cv.pages)current_page = 0def detailed_progress(progress, description):nonlocal current_pageif description["event"] == "page_parsed":current_page += 1self.pr
http://www.lryc.cn/news/530723.html

相关文章:

  • 13 尺寸结构模块(size.rs)
  • STM32单片机学习记录(2.2)
  • CSS 样式化表格:从基础到高级技巧
  • 【python】tkinter实现音乐播放器(源码+音频文件)【独一无二】
  • javascript常用函数大全
  • C#属性和字段(访问修饰符)
  • DeepSeek为什么超越了OpenAI?从“存在主义之问”看AI的觉醒
  • langchain基础(二)
  • 数据库安全管理中的权限控制:保护数据资产的关键措施
  • Leetcode598:区间加法 II
  • 【Proteus】NE555纯硬件实现LED呼吸灯效果,附源文件,效果展示
  • SAP HCM insufficient authorization, no.skipped personnel 总结归纳
  • 五. Redis 配置内容(详细配置说明)
  • 4 [危机13小时追踪一场GitHub投毒事件]
  • Shadow DOM举例
  • 力扣动态规划-18【算法学习day.112】
  • 网络基础
  • 使用 EXISTS 解决 SQL 中 IN 查询数量过多的问题
  • 使用SpringBoot发送邮件|解决了部署时连接超时的bug|网易163|2025
  • Ruby Dir 类和方法详解
  • 克隆OpenAI(基于openai API和streamlit)
  • 位运算算法题
  • 12 向量结构模块(vector.rs)
  • Android车机DIY开发之学习篇(六)编译讯为3568开发板安卓
  • Codeforces Round 863 (Div. 3) E. Living Sequence
  • 一文讲解HashMap线程安全相关问题(上)
  • MFC 创建Ribbon样式窗口
  • uv 安装包
  • IELTS口语练习题库
  • 图书管理系统 Axios 源码__获取图书列表