当前位置: 首页 > news >正文

将目录下的所有pdf文件都转换为对应名字的png图片

本来想用Foxit来把pdf转换为png,但没想到是收费的功能,所以在参考1处找了一段python代码,稍作修改实现了这个功能。做个记录后续可能有用。

在python3.9.12上运行代码遇到了版本的坑,好几个坑,最终发现只要安装这个特定版本就能解决:

pip install PyMuPDF==1.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

代码如下,不需要再单独安装fitz了,安装还是各种报错(版本问题)。

import os
import fitzpdf_dir = []def get_file():docunames = os.listdir()for docuname in docunames:if os.path.splitext(docuname)[1] == '.pdf': pdf_dir.append(docuname)def conver_img():for pdf in pdf_dir:print('process',pdf)doc = fitz.open(pdf)pdf_name = os.path.splitext(pdf)[0]for pg in range(doc.pageCount):page = doc[pg]rotate = int(0)zoom_x = 1.0zoom_y = 1.0trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)pm = page.getPixmap(matrix=trans, alpha=False)pm.writePNG('%s.png' % os.path.basename(pdf))if __name__ == '__main__':get_file()conver_img()

参考1:https://www.jianshu.com/p/83d9d1e05eb2

http://www.lryc.cn/news/153583.html

相关文章:

  • windows主机和Ubuntu虚拟机共享设置
  • 北京APP外包开发需要注意的问题
  • 自然语言处理:提取长文本进行文本主要内容(文本意思)概括 (两种方法,但效果都一般)
  • 基于SpringCloudAlibaba实现的NacosConfig
  • 景联文科技:高质量AI数据标注助力大语言模型训练,推动人工智能落地应用
  • 深度学习(前馈神经网络)知识点总结
  • 点云从入门到精通技术详解100篇-点云信息编码(中)
  • 前端刷题-Promise系列
  • 3分钟:腾讯云免费SSL证书申请教程_免费HTTPS证书50张
  • 如何快速成为一名优秀的python工程师?
  • Sqoop(二):Hive导出数据到Oracle
  • HTML数字倒计时效果附源码
  • 以udp协议创建通信服务器
  • 【数据结构】队列篇| 超清晰图解和详解:循环队列模拟、用栈实现队列、用队列实现栈
  • js+html实现打字游戏v2
  • Python之作业(一)
  • uni-app 之 v-on:click点击事件
  • 迁移学习:实现快速训练和泛化的新方法
  • 蓝队追踪者工具TrackAttacker,以及免杀马生成工具
  • ELK日志收集系统(四十九)
  • Linux知识点 -- Linux多线程(四)
  • Java设计模式:四、行为型模式-07:状态模式
  • 很多应用都是nginx+apache+tomcat
  • 原型模式:复制对象的技巧
  • ClickHouse进阶(五):副本与分片-1-副本与分片
  • Android 华为手机荣耀8X调用系统裁剪工具不能裁剪方形图片,裁剪后程序就奔溃,裁剪后获取不到bitmap的问题
  • 《Flink学习笔记》——第十二章 Flink CEP
  • 谷歌IndexedDB客户端存储数据
  • 天气数据的宝库:解锁天气预报API的无限可能性
  • 插入排序(Insertion Sort)