当前位置: 首页 > news >正文

pdf转为txt文本格式并使用base64加密输出数据

第一步,pom.xml中引入jar包 

        <dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.24</version></dependency>

 第二步

package org.example.test.example.changefile;import org.apache.pdfbox.pdmodel.PDDocument;import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Base64;public class ConvertPDFToBase64String {public static void main(String[] args) {String inputPdfPath = "C:\\Users\\EDY\\Desktop\\input.pdf"; // 输入PDF文件的路径String outputTxtPath = "C:\\Users\\EDY\\Desktop\\output.txt"; // 输出TXT文件的路径try {// 加载PDF文档try (PDDocument document = PDDocument.load(new File(inputPdfPath))) {// 创建字节输出流ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();// 将PDF文档写入字节输出流document.save(byteArrayOutputStream);// 获取PDF文档的字节数据byte[] pdfBytes = byteArrayOutputStream.toByteArray();// 使用Base64编码PDF字节数据String base64EncodedString = Base64.getEncoder().encodeToString(pdfBytes);// 将Base64编码的字符串写入TXT文件try (FileWriter writer = new FileWriter(outputTxtPath)) {writer.write(base64EncodedString);}System.out.println("PDF file has been converted to Base64 string and saved to TXT file.");}} catch (IOException e) {e.printStackTrace();}}
}

http://www.lryc.cn/news/472205.html

相关文章:

  • SpringBoot篇(运维实用篇 - 临时属性)
  • MySQL定时异机备份
  • MMA: Multi-Modal Adapter for Vision-Language Models
  • uniapp通过id获取div的宽度,高度,位置等(应该是 任意平台都通用 )
  • Python Transformer 模型的基本原理:BERT 和 GPT 以及它们在情感分析中的应用
  • 【云原生】Kubernets1.29部署StorageClass-NFS作为存储类,动态创建pvc(已存在NFS服务端)
  • 使用 Pandas 进行时间序列分析的 10个关键点
  • 使用 Mermaid 语言描述 AGI 系统架构图
  • 绘制线性可分支持向量机决策边界图 代码解析
  • No.23 笔记 | WEB安全 - 任意文件漏洞 part 5
  • EasyPlayer.js网页播放器,支持FLV、HLS、WebSocket、WebRTC、H.264/H.265、MP4、ts各种音视频流播放
  • WPF数据绑定的五大模式
  • 从零到一:大学新生编程入门攻略与成长指南
  • 详细分析Pytorch中的transpose基本知识(附Demo)| 对比 permute
  • 初识WebGL
  • 【力扣】Go语言回溯算法详细实现与方法论提炼
  • 「C/C++」C/C++ 之 第三方库使用规范
  • 六、元素应用CSS的习题
  • 正式入驻!上海斯歌BPM PaaS管理软件等产品入选华为云联营商品
  • 使用 Axios 上传大文件分片上传
  • Nginx+Lua脚本+Redis 实现自动封禁访问频率过高IP
  • PART 1 数据挖掘概论 — 数据挖掘方法论
  • Centos安装ffmpeg的方法
  • 理解SQL中通配符的使用
  • SpringBoot篇(简化操作的原理)
  • Cesium的模型(ModelVS)顶点着色器浅析
  • 机器人领域中的scaling law:通过复现斯坦福机器人UMI——探讨数据规模化定律(含UMI的复现关键)
  • C++之多态的深度剖析
  • Microsoft Office PowerPoint制作科研论文用图
  • go语言进阶之并发基础