当前位置: 首页 > news >正文

Java 读取TIFF JPEG GIF PNG PDF

Java 读取TIFF JPEG GIF PNG PDF

本文解决方法基于开源 tesseract

  1. 下载适合自己系统版本的tesseract ,官网链接:https://digi.bib.uni-mannheim.de/tesseract/

在这里插入图片描述

2. 下载之后安装,安装的时候选择选择语言包,我选择了中文和英文

在这里插入图片描述
3. 如官网说明 Windows本机库是用Visual Studio构建的 需要依赖 Visual C++ 2015-2022 Redistributable Packages. 如果在window 上运行的话需要下载且安装。下载地址 :https://learn.microsoft.com/en-US/cpp/windows/latest-supported-vc-redist?view=msvc-170
在这里插入图片描述
选择下载合适的版本
在这里插入图片描述
不安装可能会报错

 exception in thread "main" java.lang.unsatisfiedlinkerror: 找不到指定的模块。

安装后需要重启电脑

  1. 写几行代码尝试读取图片中的文字
    public static void main(String[] args) {Tesseract tesseract = new Tesseract();// 读取中文tesseract.setLanguage("chi_sim");try {// 安装tessdata 的路径tesseract.setDatapath("D:\\Software\\tessdata");BufferedImage image = ImageIO.read(new File(path));// 要读取的文件String text = tesseract.doOCR(image);System.out.print(text);}catch (TesseractException e) {e.printStackTrace();}}

R-C.jpg 图片
在这里插入图片描述

运行的结果如下:
在这里插入图片描述

http://www.lryc.cn/news/149625.html

相关文章:

  • 研磨设计模式day14模板方法模式
  • 7 集群基本测试
  • chrono学习(一)
  • 后端面试话术集锦第 十 篇:springMVC面试话术
  • 基于Django 框架搭建的机器学习在线平台源代码+数据库,实现KNN、ID3、C4.5、SVM、朴素贝叶斯、BP神经网络等算法及流程管理
  • 大数据组件-Flume集群环境搭建
  • 想系列服务迁移专有云效实操
  • 2020 牛客多校第三场 C Operation Love (叉积判断顺逆时针)
  • 基于OFDM的水下图像传输通信系统matlab仿真
  • Docsify + Gitalk详细配置过程讲解
  • React中的setState的执行机制
  • 2023最新任务悬赏平台源码uniapp+Thinkphp新款悬赏任务地推拉新充场游戏试玩源码众人帮威客兼职任务帮任务发布分销机
  • 微服务事务管理(Dubbo)
  • Springboot整合ClickHouse
  • 【材料整理】-- Python、Matlab中常用调试代码,持续更新!
  • 什么是同源策略(same-origin policy)?它对AJAX有什么影响?
  • 视频汇聚/视频云存储/视频监控管理平台EasyCVR接入海康SDK协议后无法播放该如何解决?
  • CSC2121A
  • 高级进程编程-系统调用-创建守护进程
  • Redis之发布订阅
  • 交换机 路由器的常见指令
  • Matlab 基本教程
  • 现浇钢筋混泥土楼板施工岗前安全VR实训更安全高效
  • ARDUINO STM32 SSD1306
  • 临时抱佛脚
  • 城市内涝积水监测预警系统 yolov8
  • 数据库备份与恢复
  • ssm+vue高校实验室管理系统源码和论文
  • npm报错sass
  • [系统安全] 五十三.DataCon竞赛 (2)2022年DataCon涉网分析之恶意样本IOC自动化提取数据集详解