当前位置: 首页 > news >正文

python实现pdf转换为word文档,尽量保持格式不变

from pdf2docx import Converterdef convert_pdf_to_word(pdf_path, docx_path, font_path):# 创建 pdf2docx.Converter 对象,用于进行 PDF 到 Word 文档的转换操作。cv = Converter(pdf_path)# 设置系统默认字体文件的路径cv.font_path = font_path#  docx_path  转换后的文档路径   start end 用于指定转换的页面范围  为None 则转换整个pdf文件cv.convert(docx_path, start=0, end=None)# 关闭转换器cv.close()# pdf文件名
pdf_file = "2023_PDF.pdf"
# word文件名
word_file = "output.docx"
default_font = r"C:\Windows\Fonts\Candarai.ttf"  # 替换为系统默认字体文件的路径convert_pdf_to_word(pdf_file, word_file, default_font)

上述方法适用于 一般的pdf转换。像简历之类的pdf转换会报字体错误。

查看系统所有字体路径

import matplotlib.font_manager as fm# 获取系统中可用的字体列表
font_list = fm.findSystemFonts()# 打印字体列表
for font_path in font_list:print(font_path)

查看指定字体路径

import os
from ctypes import windll, create_unicode_bufferdef find_arial_font_path():# 获取 Arial 字体文件的完整路径font_name = "Calibri"buffer_size = 1024font_buffer = create_unicode_buffer(buffer_size)# 获取 Windows 系统目录路径result = windll.kernel32.GetSystemWindowsDirectoryW(font_buffer, buffer_size)if result == 0:return Nonewindows_directory = font_buffer.valuefont_file = os.path.join(windows_directory, "Fonts", font_name + ".ttf")if os.path.isfile(font_file):return font_fileelse:return None# 查找 Calibri 字体的路径
arial_font_path = find_arial_font_path()
print(arial_font_path)

http://www.lryc.cn/news/94503.html

相关文章:

  • TCP / IP 网际层的 4 个重要协议
  • MySQL阶段DAY20(附笔记)
  • 考场作弊行为自动抓拍告警算法 yolov7
  • 在Linux中安装RabbitMQ
  • electron 单个实例控制以及日志输出
  • 基于matlab使用AprilTag标记进行相机校准(附源码)
  • 计算机网络————运输层
  • 【雕爷学编程】Arduino动手做(154)---AFMotor电机扩展板模块
  • 【RPC】—Protobuf入门
  • 【⑩MySQL】:表管理,让数据管理不再困难
  • Springboot项目使用原生Websocket
  • 在Vue 3中如何实现服务端渲染(SSR)
  • 【计算机组成原理期末课设作业】16位微型计算机实现——MOVS串传送扩展指令设计
  • CodeMirror 对 XML 文档熟悉及元素控制自定义
  • Jetpack - ViewModel
  • 【新版系统架构】第十三章-层次式架构设计理论与实践
  • 剖析Linux文件系统
  • 简介Maven结构与配置方法
  • 好用的网址6
  • MySQL数据库---笔记5
  • Yocto:初始
  • autodl算力租用平台应用于pycharm
  • 高德地图的使用
  • <List<Map<String,String>>> 删除元素常见的误区以及删除方法
  • Linux下的编辑器——vim的简单上手指南
  • C++多线程学习(二、多线程的几种创造方式【有返回值的之后讲】)
  • 前端开发框架生命周期详解:Vue、React和Angular
  • 【Java从入门到大牛】程序流程控制
  • UML学习统一建模语言
  • 【C++学习笔记】RAII思想——智能指针