当前位置: 首页 > news >正文

使用python将PDF转word

实现功能,将程序所在当前路径下的所有PDF文件转化为word

import os
from pdf2docx import Converter# 获取当前路径
current_path = os.getcwd()# 遍历当前路径下的所有文件和文件夹
for file_name in os.listdir(current_path):# 检查文件是否为 PDF 文件if file_name.endswith(".pdf"):# 构建输入和输出文件路径pdf_file_path = os.path.join(current_path, file_name)docx_file_path = os.path.join(current_path, os.path.splitext(file_name)[0] + ".docx")# 创建 Converter 对象并将 PDF 转换为 DOCXcv = Converter(pdf_file_path)cv.convert(docx_file_path, start=0, end=None)cv.close()print(f"已将 {file_name} 转换为 {os.path.basename(docx_file_path)}")

上述代码中使用了 os 模块来获取当前路径及构建文件路径,使用了 pdf2docx 模块来进行 PDF 到 DOCX 的转换。通过遍历当前路径下的所有文件和文件夹,并判断是否是 PDF 文件,将其转换为 DOCX 文件。

可以使用以下命令进行安装pdf2docx 模块:

pip install pdf2docx

运行上述代码后,将会在当前路径下生成与每个 PDF 文件对应的 DOCX 文件。

 

可执行程序(可直接运行)可从资源中直接下载使用

 

http://www.lryc.cn/news/98995.html

相关文章:

  • CMU 15-445 -- Logging Schemes - 17
  • 逻辑回归分析实战(根据鸢尾花的性质预测鸢尾花类别)
  • 【每日一题】2050. 并行课程 III
  • 【kubernetes系列】kubernetes之使用kubeadm搭建高可用集群
  • SpringBoot 快速实现 IP 地址解析
  • 【云原生】Docker镜像的创建,Dockerfile
  • 了解Unity编辑器之组件篇Event(七)
  • bash: 睡觉的冒号;是不是两个点?
  • 揭秘爱数AnyShare认知助手:大模型深度产品化,深化人与机器的“分工协作”
  • ad+硬件每日学习十个知识点(10)23.7.21
  • RCU 使用及机制源码的一些分析
  • 【第二套】Java面试题
  • CSS3 实现边框圆角渐变色渐变文字效果
  • 第二天 kali代理配置
  • stable-diffusion-webui汉化教程
  • 热备盘激活失败导致raid5阵列崩溃的服务器数据恢复案例
  • 【ribbon】Ribbon的负载均衡和扩展功能
  • 数据链路层是如何传递数据的
  • 积分规划:构建全面的会员积分管理系统
  • amd的cpu有哪些型号(amd的cpu系列介绍)
  • 网络安全(黑客)自学——从0开始
  • uniapp使用uni-swipe-action后右侧多了小于1px的间隙
  • 随手笔记——演示如何提取 ORB 特征并进行匹配
  • Python访问者模式介绍、使用
  • 深度学习实际使用经验总结
  • 【广州华锐互动】AR智慧机房设备巡检系统
  • 关于Ubuntu 18.04 LTS环境下运行程序出现的问题
  • 「苹果安卓」手机搜狗输入法怎么调整字体大小及键盘高度?
  • 【人工智能】神经网络、前向传播、反向传播、梯度下降、局部最小值、多层前馈网络、缓解过拟合的策略
  • 一个tomcat部署两个服务的server.xml模板