当前位置：首页 > news >正文

捕捉时刻：将PDF文件中的图像提取为个性化的瑰宝（从pdf提取图像）

news 2025/9/13 1:47:38

应用场景：

该功能的用途是从PDF文件中提取图像。这在以下情况下可能会很有用：

图片提取和转换：可能需要将PDF文件中的图像提取出来，并保存为单独的图像文件，以便在其他应用程序中使用或进行进一步处理。例如，可能需要将PDF中的图像用于网页、报告、演示文稿等。
图像分析和处理：如果需要对PDF文件中的图像进行深入分析、处理或计算机视觉任务，例如图像识别、目标检测、图像分类等，那么可以使用该功能提取图像，然后使用适当的图像处理库或算法进行进一步处理。
数据提取和挖掘：在某些情况下，PDF文件可能包含了一些以图像形式嵌入的文本或数据，例如扫描的文档或PDF中的图表、表格等。通过提取图像，可以尝试使用OCR（光学字符识别）技术来提取和分析这些图像中的文本或数据。

无论的具体用途是什么，该功能可以帮助从PDF文件中轻松提取图像，并将其保存为单独的图像文件，以便进一步使用和处理。

源代码：

import wx 
import fitz
import osclass PdfImageExtractor(wx.Frame):def __init__(self):wx.Frame.__init__(self, None, title='PDF Image Extractor')self.panel = wx.Panel(self)self.pdf_file_picker = wx.FilePickerCtrl(self.panel, message='选择PDF文件')self.output_dir_picker = wx.DirPickerCtrl(self.panel, message='选择输出目录')self.extract_button = wx.Button(self.panel, label='提取图片')self.extract_button.Bind(wx.EVT_BUTTON, self.onExtract)sizer = wx.BoxSizer(wx.VERTICAL)sizer.Add(self.pdf_file_picker, 0, wx.ALL|wx.CENTER, 5)sizer.Add(self.output_dir_picker, 0, wx.ALL|wx.CENTER, 5)sizer.Add(self.extract_button, 0, wx.ALL|wx.CENTER, 5)self.panel.SetSizer(sizer)self.progress = wx.Gauge(self.panel, range=100)sizer.Add(self.progress, 0, wx.ALL|wx.EXPAND, 5)self.Show()def onExtract(self, event):pdf_path = self.pdf_file_picker.GetPath()output_dir = self.output_dir_picker.GetPath()if not os.path.exists(output_dir):os.makedirs(output_dir)pdf = fitz.open(pdf_path)total_pages = len(pdf)for i, page in enumerate(pdf):images = page.get_images()if images:for image in images:xref = image[0]pix = fitz.Pixmap(pdf, xref)filename = os.path.join(output_dir, str(i) + '.png')pix.save(filename)pix = Noneself.progress.SetValue(int((i+1)/total_pages*100))pdf.close()self.progress.SetValue(100)if __name__ == '__main__':app = wx.App()frame = PdfImageExtractor()app.MainLoop()

源代码分析：

解释一下这个PDF图片提取的代码:

导入需要的库:
- wx - 用于构建GUI的wxPython库
- fitz - pyMuPDF库,用于读取和处理PDF
- os - 用于文件系统操作如创建文件夹
定义PdfImageExtractor类,继承wx.Frame来创建窗口
- 在__init__方法中初始化界面元素:文件选择框、文件夹选择框、按钮、进度条等
- Show()显示窗口
onExtract方法中含有主要逻辑
- 获取选择的PDF路径和输出文件夹路径
- 使用fitz打开PDF
- 遍历每页:
  - 使用page.getImages()获取图片列表
  - 遍历图片列表
    - 从image对象直接提取PixMap
    - 保存为PNG文件,文件名为页码
- 更新进度条
主函数中:
- 创建wx App和PdfImageExtractor框架
- 进入主循环显示界面