当前位置: 首页 > news >正文

python:reportlab 将多个图片合并成一个PDF文件

承上一篇:java:pdfbox 3.0 去除扫描版PDF中文本水印

# 导出扫描版PDF文件中每页的图片文件

java -jar pdfbox-app-3.0.3.jar export:images -prefix=test -i your_book.pdf
导出
Writing image: test-1.jpg
Writing image: test-2.jpg
Writing image: test-3.png
……

在日常工作中,我们经常需要将多张图片合并成一个PDF文件,以便于分享或打印。Python作为一种强大的编程语言,提供了丰富的库和工具,使得这一任务变得非常简单。在本文中,我们将介绍如何使用Python合并多张图片并生成一个PDF文件的方法。我们需要安装两个库:Pillow 和ReportLab。Pillow 用于处理图片,ReportLab 用于生成PDF文件。
pip install Pillow
pip install reportlab
  reportlab-4.2.2-py3-none-any.whl (1.9 MB)

编写 merge_pdf1.py  如下

# -*- coding: utf-8 -*-
""" PyMuPDF 将多个图片合并成一个PDF文件 """
import os
from PIL import Image
from reportlab.pdfgen import canvasimages_dir = "." # imgs
tmpdir = r"\tmp" # Win 10def revise(s):""" 修正图片文件名中的数字,假设0<页数<=999 """prefix = s[0:5]d = s.split('-')[1].split('.')[0]ext = s.split('.')[1]# 数字前补零if len(d) ==1:d = '00'+delif len(d) ==2:d = '0' +delse:passfilename = prefix + d +'.'+extos.rename(s, filename)return filenamedef merge_images_to_pdf(image_list, output_pdf):""" 使用画布 """c = canvas.Canvas(output_pdf)for image in image_list:print(image)img = Image.open(image)c.setPageSize((img.width, img.height))c.drawInlineImage(image, 0, 0)c.showPage()c.save()# main()
# 图片路径列表
img_list = [f for f in os.listdir(images_dir) if f.endswith(".jpg") or f.endswith(".png")]
imgs_list = []
for img in img_list:imgs_list.append(revise(img))
# 修正img文件名后排序
imgs_list = sorted(imgs_list)
# 输出PDF文件路径
output_path = os.path.join(tmpdir, 'result.pdf')
merge_images_to_pdf(imgs_list, output_path)

运行 python merge_pdf1.py 
生成 \tmp\result.pdf 

在这段代码中,我们首先导入了必要的库。然后定义了一个名为 merge_images_to_pdf 的函数,该函数将接受一个图片列表和输出PDF文件的路径作为参数。在函数中,我们使用 Pillow库打开每张图片,并将其逐一添加到PDF中。最后,我们保存生成的PDF文件。

http://www.lryc.cn/news/453415.html

相关文章:

  • 决策树:机器学习中的强大工具
  • 平面电磁波(解麦克斯韦方程)电场相位是复数的积分常数,电场矢量每个分量都有一个相位。磁场相位和电场一样,这是因为无损介质中实数的波阻抗
  • 复习HTML(进阶)
  • Qt 每日面试题 -7
  • 《计算机原理与系统结构》学习系列——计算机的算数运算(下)
  • 二叉树进阶学习——从前序和中序遍历序列构造二叉树
  • 【数据分享】2000—2023年我国省市县三级逐年植被覆盖度(FVC)数据(Shp/Excel格式)
  • 【Python】Streamlit:为数据科学与机器学习打造的简易应用框架
  • OpenJudge | 置换选择排序
  • 如何提取b站的视频字幕,下载视频
  • Vue中使用ECharts实现热力图的详细教程
  • Arduino UNO R3自学笔记13 之 Arduino使用LM35如何测量温度?
  • 蓝桥杯【物联网】零基础到国奖之路:十六. 扩展模块之矩阵按键
  • Apollo9.0 Planning2.0决策规划算法代码详细解析 (4): PlanningComponent::Proc()
  • AAA Redis的过期删除策略+缓存雪崩+缓存一致性问题
  • 成都跃享未来教育咨询有限公司抖音小店:引领教育咨询新风尚
  • 【堆排】为何使用向下调整法建堆比向上调整法建堆更好呢?
  • 在Stable Diffusion WebUI中安装SadTalker插件时几种错误提示的处理方法
  • 使用ffmpeg合并视频和音频
  • 周末总结(2024/10/05)
  • 在Ubuntu中自动挂载SMB/CIFS共享
  • pWnOS2.0 靶机渗透( cms 渗透,php+mysql 网站渗透,密码碰撞)
  • 【AI】AIOT简介
  • picgo + typora + gitee图床
  • 【路径规划】多机器人路径规划
  • 深度学习Day-35:One-hot独热编码
  • Streamlit 实现登录注册验证
  • ASP.NET Zero 多租户介绍
  • 【60天备战2024年11月软考高级系统架构设计师——第29天:微服务架构——微服务的优缺点】
  • 读论文、学习时 零碎知识点记录01