当前位置: 首页 > news >正文

Java html生成pdf和图片

在 Java 项目中将 HTML 生成图片是一项常见需求,特别是用于生成报告、预览页面截图等。不同的库和工具在渲染能力、性能以及支持的功能上有所不同。以下是几种主流的技术选型和对比,帮助你选择适合的解决方案。

技术对比总结

技术名称优点缺点适用场景
Html2Image简单易用,轻量级,Java 原生支持支持 HTML、CSS 和 JS 的能力较弱静态 HTML 到图片的简单场景
OpenHtmlToPdf支持丰富的 HTML 和 CSS,输出多种格式不支持 JS 动态内容,转换步骤稍复杂静态 HTML 生成 PDF 或图片
wkhtmltoimage高质量渲染,支持复杂 HTML、CSS 和 JS需要外部工具,性能可能较慢需要高质量渲染的复杂页面
Selenium + Headless完全支持动态页面和 JavaScript需要配置无头浏览器,资源消耗较大动态网页、复杂前端页面的截图
Puppeteer强大的渲染和操作能力,完全支持 HTML、CSS 和 JS依赖 Node.js,集成较为复杂动态网页渲染和交互,现代 Web 应用
Flying Saucer + Batik支持 XHTML、CSS 和 SVG,适合标准化文档不支持 JavaScript,支持的 CSS 有限静态 HTML 和 SVG 文档生成

下面主要对Html2Image和OpenHtmlToPdf进行讲解说明

1. Html2Image

简介

Html2Image 是一个 Java 库,能够直接将 HTML 转换为图片。该库依赖于 Flying Saucer 等 HTML 渲染引擎来处理 HTML 和 CSS。

优点
  • 轻量级:易于使用,依赖较少。
  • Java 原生支持:无需外部工具,适合与 Java 项目集成。
缺点
  • CSS 支持有限:对复杂的 CSS 或 JavaScript 支持较弱。
  • 渲染效果一般:渲染复杂页面或带有动态效果的内容时效果不佳。
适用场景

适合静态页面和简单的 HTML 转换需求,如邮件内容、简单报告等。

代码示例
   <dependency><groupId>gui.ava</groupId><artifactId>html2image</artifactId><version>2.0.1</version></dependency>

引包即用

Html2Image html2Image = Html2Image.fromHtml("<html><body>Hello, World!</body></html>");
html2Image.saveAsImage(new File("output.png"));

2. OpenHtmlToPdf(强烈推介)

简介

OpenHtmlToPdf 是一个用于将 HTML 转换为 PDF 的 Java 库,但它也支持将 HTML 转换为 PNG 等图片格式。它基于 Flying Saucer 渲染 HTML。

优点
  • 支持复杂的 HTML 和 CSS:对大部分 HTML 和 CSS 有较好的支持。
  • 多格式支持:除了 PDF,也支持 PNG、JPG 输出。
缺点
  • 不支持 JS 动态内容:不能处理需要 JavaScript 动态渲染的页面。需要额外引入中文字体包,对中文支持不是很友好。字体包链接提取
  • 相对复杂:需要渲染 PDF,再转换为图片,增加了步骤。
适用场景

适合生成静态报告、发票、合同等场景,尤其是同时需要生成 PDF 和图片格式时。

代码示例

需要引入如下包

  <!-- Openhtmltopdf 用于将 HTML 转换为 PDF --><dependency><groupId>at.datenwort.openhtmltopdf</groupId><artifactId>openhtmltopdf-java2d</artifactId><version>1.1.3</version></dependency><!-- PDFBox 用于将 PDF 转换为图片 --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.24</version></dependency><!-- PDFBox 渲染依赖 --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox-tools</artifactId><version>2.0.24</version></dependency>

核心代码如下

        ByteArrayOutputStream bao = new ByteArrayOutputStream();ITextRenderer renderer = new ITextRenderer();ITextFontResolver fontResolver = renderer.getFontResolver();// 设置字体fontResolver.addFont("中文字体包路径", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);renderer.setDocumentFromString(html);renderer.layout();renderer.createPDF(bao);

注意如果中文字体识别需要在html中指定字体包
例如:

<body style="font-family: SimSun">

选择建议

  • 如果需要简单的 HTML 静态页面生成图片Html2ImageOpenHtmlToPdf 是较好的选择。
  • 如果需要高质量的图片输出,且页面较为复杂,使用 wkhtmltoimage 或 Selenium 结合无头浏览器会更好
http://www.lryc.cn/news/441166.html

相关文章:

  • JavaWeb笔记整理——Redis
  • 数据库(mysql)常用命令
  • 源网荷储一体化新型电力系统解决方案
  • 树莓派安装 OpenCV 教程
  • 01,大数据总结,zookeeper
  • 伪工厂模式制造敌人
  • 【linux】pwd命令
  • Python 如何封装工具类方法,以及使用md5加密
  • 网络编程的应用
  • 佰朔资本:国内海风加速招标 船舶行业景气上行
  • 理解AAC和Opus的编码与解码流程
  • 设计图纸加密方法知多少?小编给你讲清楚
  • pycv实时目标检测快速实现
  • 记录下如何让字体在div内 自动换行 上下居中
  • Shell篇之编写MySQL启动脚本
  • supermap Iclient3d for cesium加载地形并夸大地形
  • 一文解读OLAP的工具和应用软件
  • xml重点笔记(尚学堂 3h)
  • 爬虫代理API的全面解析:让数据抓取更高效
  • PCL 点云中的植被信息提取(C++详细过程版)
  • requests-html的具体使用方法有哪些?
  • YOLOv9改进策略【卷积层】| AKConv: 具有任意采样形状和任意参数数量的卷积核
  • 图神经网络池化方法
  • 小琳AI课堂:确保大语言模型安全的八大策略--从数据隐私到用户教育
  • Python 数学建模——高斯核密度估计
  • Flink+Spark相关记录
  • 2023 hnust 湖科大 毕业实习 报告+实习鉴定表
  • ConflictingBeanDefinitionException | 运行SpringBoot项目时报错bean定义冲突解决方案
  • 如何切换淘宝最新镜像源(npm)【2024版】
  • YoloV10改进策略:Block改进|PromptIR(NIPS‘2023)|轻量高效,即插即用|(适用于分类、分割、检测等多种场景)