当前位置: 首页 > news >正文

什么是线性化PDF?

线性化PDF是一种特殊的PDF文件组织方式。

总体而言,PDF是一种极为优雅且设计精良的格式。PDF由大量PDF对象构成,这些对象用于创建页面。相关信息存储在一棵二叉树中,该二叉树同时记录文件中每个对象的位置。因此,打开文件时只需加载这棵树,随后便可借助它加载显示页面所需的对象。无需读取整个文件,仅读取这棵树即可。树的位置始终存储在文件末尾,所以很容易找到,而且只需追加新信息和一棵新树,就能轻松修改文件。

然而,如果通过网络读取文件,它是以字节流的形式被访问的。这意味着,必须在整个PDF文件传输完毕后,才能读取位于文件末尾的引用。对于大文件而言,这可能需要一些时间。

 

如何创建线性化PDF

于是,Adobe创建了一种新的PDF布局方式,即线性化PDF。其文件格式依然不变,但在文件开头有一个特殊标记,创建第一页所需的所有对象(以及描述这些对象的一个小型二叉树)都存储在文件开头。一旦读取了这些数据,即可显示第一页,同时文件的其余部分继续下载。这使得整个过程看起来快得多,即便对于超大文件,用户也几乎能立刻看到一些内容。

 

线性化PDF与非线性化PDF有何区别

线性化PDF用于按页面顺序有序地组织内部组件,这有助于提升网页浏览体验,使用户能够尽快查看最想看的页面。而非线性化PDF的对象分散在整个文件中,必须完全下载后才能查看。

 

如何检查PDF是否为线性化的?

在Adobe Acrobat和Adobe Reader中,查看PDF是否为线性化的最佳方法是查看文档属性。如果文件是线性化PDF,“快速网络视图”这一项将显示“是”。


 

在JPedal PDF阅读器中,我们也添加了类似功能,可在文档属性中显示文件是否为线性化PDF。如果是线性化PDF,“linearized(线性化)”一词会出现在常规信息部分中PDF版本之后。

 

用于查看PDF文件是否为线性化的Java代码

在JPedal中,你也可以通过编程方式检查文件是否为线性化的,方法是查看Linearized对象是否存在——如果存在,那它就是一个线性化的PDF。

final PdfUtilities extract = new PdfUtilities(filename);

if (extract.openPDFFile()) {

final boolean isLinearized = extract.isPDFLinearized();

}

extract.closePDFfile();

 

为什么线性化PDF很重要?

简而言之,线性化PDF是一种组织PDF文件的方式,这样如果要通过互联网访问该文件,它的加载速度会显得快很多。而且它确实能很好地做到这一点!

 

我们的主页:PDF 转 HTML5、Java 图像库、Java PDF SDK - IDRsolutions

关注我们🛰️:IDRSolutions

 

http://www.lryc.cn/news/529231.html

相关文章:

  • 每日一题——序列化二叉树
  • Transformer+vit原理分析
  • 「AI学习笔记」深度学习的起源与发展:从神经网络到大数据(二)
  • 【漫话机器学习系列】069.哈达马乘积(Hadamard Product)
  • 2025一区新风口:小波变换+KAN!速占!
  • 相同的树及延伸题型(C语言详解版)
  • 【Redis】 String 类型的介绍和常用命令
  • LLM - 大模型 ScallingLaws 的设计 100B 预训练方案(PLM) 教程(5)
  • Docker/K8S
  • 32、【OS】【Nuttx】OSTest分析(1):stdio测试(二)
  • git push到远程仓库时无法推送大文件
  • Vue.js路由管理与自定义指令深度剖析
  • NVIDIA GPU介绍:概念、序列、核心、A100、H100
  • 【PyTorch】6.张量运算函数:一键开启!PyTorch 张量函数的宝藏工厂
  • C语言练习(31)
  • 什么是长短期记忆网络?
  • git中有关old mode 100644、new mode 10075的问题解决小结
  • Jenkins上生成的allure report打不开怎么处理
  • JSR303校验教学
  • 使用DeepSeek技巧:提升内容创作效率与质量
  • 【第六天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-一种常见的贪心算法(持续更新)
  • C# Winform制作一个登录系统
  • 算法总结-哈希表
  • 向下调整算法(详解)c++
  • 蓝桥杯之c++入门(一)【C++入门】
  • 使用Python爬虫获取1688商品拍立淘API接口(item_search_img)的实战指南
  • ElasticSearch-文档元数据乐观并发控制
  • 使用Navicat Premium管理数据库时,如何关闭事务默认自动提交功能?
  • 【单细胞-第三节 多样本数据分析】
  • (java) IO流