当前位置: 首页 > news >正文

Java 如何从图片上提取文字

生活中我们可能会遇到想从图片上直接复制上边的文字,该如何获取呢,接下来看看如何使用Java程序实现从图片中读取文字。

实现过程

1、引入Tess4J 依赖

<!--Tess4J 依赖-->
<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>5.12.0</version></dependency>

2、下载字体库
https://github.com/tesseract-ocr/tessdata
3、核心代码

	// imagePath为图片路径,language为识别语言public String getWordFromImage(String imagePath, String language) {//创建Tesseract对象ITesseract tesseract = new Tesseract();//设置字体库路径tesseract.setDatapath("E:\\xxxx\\traineddata");//设置识别语言 chi_sim/engtesseract.setLanguage(language);//执行ocr识别String result = null;try {result = tesseract.doOCR(new File(imagePath));} catch (TesseractException e) {log.error("识别有误",e);}return result;}

错误处理

Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory
在这里插入图片描述
出现这个问题的原因是设置字体库路径时,路径中包含中文无法识别,需要把字体库放到一个全英文的路径下即可

ITesseract tesseract = new Tesseract();
//设置字体库路径
tesseract.setDatapath("E:\\xxx\\xxx\\traineddata");

这里的路径不可以包含中文,不然读取不到

http://www.lryc.cn/news/450653.html

相关文章:

  • C#进阶-读写Excel常用框架及其使用方式
  • Python爬虫lxml模块安装导入和xpath基本语法
  • python魔法(python高级magic方法进阶)
  • 【论文笔记】Flamingo: a Visual Language Model for Few-Shot Learning
  • 问:JAVA阻塞队列实现类及最佳实践?
  • Springboot3 + MyBatis-Plus + MySql + Vue + ProTable + TS 实现后台管理商品分类(最新教程附源码)
  • 消费电子制造企业如何使用SAP系统提升运营效率与竞争力
  • 算法记录——树
  • 单片机在控制和自动化任务中的应用场景广泛
  • UEFI EDK2框架学习(三)——protocol
  • PostgreSQL的字段存储类型了解
  • CTFshow 命令执行 web29~web36(正则匹配绕过)
  • 【顺序表使用练习】发牌游戏
  • 1.7 编码与调制
  • 004集—— txt格式坐标写入cad(CAD—C#二次开发入门)
  • CSS中的font-variation-settings:探索字体的可变性
  • 组合优化与凸优化 学习笔记5 对偶拉格朗日函数
  • 监控易监测对象及指标之:Exchange邮件服务器监测
  • 【机器学习基础】Transformer学习
  • mysql如何不使用窗口函数,去统计出入库情况
  • uni-app canvas文本自动换行
  • 【设计模式-职责链】
  • Prompt:在AI时代,提问比答案更有价值
  • whatis命令:关于命令的简短描述
  • ICM20948 DMP代码详解(54)
  • RabbitMQ的应用问题
  • C++14:通过make_index_sequence实现将tuple转换为array
  • Linux中修改MySQL密码
  • 华为OD真题机试-英文输入法(Java)
  • 【React 】入门Day01 —— 从基础概念到实战应用