当前位置: 首页 > news >正文

通过Python设置及读取PDF属性,轻松管理PDF文档

PDF文档属性是嵌入在PDF文档中的一些与文档有关的信息,如作者、制作软件、标题、主题等。PDF属性分为默认属性和自定义属性两种,其中默认属性是一些固定的文档信息,部分信息自动生成(如文件大小、页数、页面大小等信息),其他信息则可以进行设置。设置这些文档属性可以帮助文档阅读者快速地掌握文档的主要内容以及关键信息,同时方便对文档进行整理归纳。本文将介绍如何使用Python通过简单的操作设置PDF文档属性

  • 设置PDF文档默认属性和自定义属性
  • 获取PDF文档默认属性和自定义属性

本文所使用的方法需要用到Spire.PDF for Python,一个PDF文档处理API,可通过官网获取或通过PyPI安装:

pip install Spire.PDF

设置PDF文档默认属性和自定义属性

使用 PdfDocument.DocumentInformation 属性可以获取PDF文档的属性信息(PdfDocumentInformation对象),接着使用 PdfDocumentInformation 类下的属性以及PdfDocumentInformation.SetCustomProperty() 方法可对PDF文档的默认属性和自定义属性进行设置。下面是示例:

  1. 创建 PdfDocument 对象并使用 PdfDocument.LoadFromFile() 方法加载PDF文档。
  2. 通过 PdfDocument.DocumentInformation 属性获取该PDF文档的属性。
  3. 通过 PdfDocumentInformation 下的属性设置PDF默认属性。
  4. 使用 PdfDocumentInformation.SetCustomProperty() 方法设置PDF自定义属性。
  5. 使用 PdfDocument.SaveToFile() 方法保存PDF文档。

代码示例
Python

from spire.pdf import *
from spire.pdf.common import *# 创建PdfDocument对象并载入PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("示例.pdf")# 获取PDF文档属性
properties = pdf.DocumentInformation# 设置PDF默认属性
properties.Author = "乔林"
properties.Creator = "PDF制作器"
properties.Keywords = "数据库;云数据库"
properties.Subject = "云数据库及其优势介绍"
properties.Title = "云数据库的力量:强化数字化企业"
properties.Producer = "PDF制作器 1.3"# 设置PDF自定义属性
properties.SetCustomProperty("公司", "科技有限公司")
properties.SetCustomProperty("标签", "数据服务,数据储存,云数据库")# 保存PDF文档
pdf.SaveToFile("PDF属性.pdf")
pdf.Close()

设置效果
设置PDF文档默认属性和自定义属性

获取PDF文档默认属性和自定义属性

获取PDF文档属性也可以通过类似的操作。在获取PDF文档属性信息后,直接通过 PdfDocumentInformation 类下的属性获取指定的默认属性内容,自定义属性内容则可以通过 PdfDocumentInformation.GetCustomProperty() 方法获取。下面是示例:

  1. 创建 PdfDocument 对象并使用 PdfDocument.LoadFromFile() 方法加载PDF文档。
  2. 通过 PdfDocument.DocumentInformation 属性获取该PDF文档的属性。
  3. 通过 PdfDocumentInformation 类下的属性获取特定属性。
  4. 使用 PdfDocumentInformation.GetCustomProperty() 方法获取特定的自定义属性。
  5. 输出属性内容。

代码示例
Python

from spire.pdf import *
from spire.pdf.common import *# 创建PdfDocument对象并载入PDF文档
pdf = PdfDocument()
pdf.LoadFromFile("PDF属性.pdf")# 获取PDF文档属性
properties = pdf.DocumentInformation# 创建字符串
information = ""# 获取默认属性
information += "作者: " + properties.Author
information += "\n标题: " + properties.Title
information += "\n主题: " + properties.Subject
information += "\n关键字: " + properties.Keywords
information += "\n应用程序: " + properties.Creator
information += "\nPDF 制作程序: " + properties.Producer# 获取自定义属性
information += "\n公司: " + properties.GetCustomProperty("公司")
information += "\n标签: " + properties.GetCustomProperty("标签")# 输出文档属性
print(information)
pdf.Close()

输出结果
获取PDF文档默认属性和自定义属性

以上内容介绍了如何使用Python设置和获取PDF文档的默认属性和自定义属性,帮助文档管理及文档识别。Spire.PDF for Python还支持许多其他功能,前往Spire.PDF for Python教程查看更多内容。

http://www.lryc.cn/news/231139.html

相关文章:

  • 10. 深度学习——模型优化
  • macos 上彻底卸载 DevEco Studio
  • Nginx(五) break,if,return,rewrite和set指令的执行顺序深究
  • 八大学习方法(金字塔模型、费曼学习法、布鲁姆学习模型)
  • K8S的基础知识
  • java:基于jjwt写一个jwt工具类
  • AK F.*ing leetcode 流浪计划之半平面求交
  • docker搭建zokeeper集群、kafka集群
  • 【java学习—十四】反射机制调用指定方法、指定属性(5)
  • PC端微信@所有人逻辑漏洞
  • 如何在Windows 10中进行屏幕截图
  • 【nlp】2.4 GRU模型
  • 国科云:浅谈DNS缓存投毒常见类型和防御策略
  • Linux命令(120)之tcpdump
  • 2311rust对接C
  • MYSQL字符串函数详解和实战(字符串函数大全,内含示例)
  • 从C语言到C++_40(多线程相关)C++线程接口+线程安全问题加锁(shared_ptr+STL+单例)
  • Angular 指令介绍及使用(三)
  • 小学生加减乘除闯关运算练习流量主微信小程序开发
  • 普通测径仪升级的智能测径仪 增添11大实用功能!
  • vue做的一个一点就转的转盘(音乐磁盘),点击停止时会在几秒内缓慢停止,再次点击按钮可以再次旋转,
  • Spring6(一):入门案例
  • Linux中报错no space device解决思路
  • vue3使用element-plus
  • 高质量实时渲染笔记
  • 云原生下GIS服务规划与设计
  • VBA 宏For WPS(完整版)-供大家学习研究参考
  • 【Linux】八、进程通信
  • 不同类型的软件企业该如何有效的管理好你的软件测试团队?
  • vue echart 立体柱状图 带阴影