当前位置: 首页 > news >正文

springboot实现OCR

1、引入依赖

<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version>
</dependency>

2、config

@Configuration
public class TessOcrConfiguration {@Beanpublic Tesseract tesseract() {Tesseract tesseract = new Tesseract();// 设置训练数据文件夹路径tesseract.setDatapath("D:/tessdata");// 设置为中文简体tesseract.setLanguage("chi_sim");return tesseract;}
}

3、定义api

@PostMapping(value = "/ocr", consumes = MediaType.MULTIPART_FORM_DATA_VALUE)
public String ocr(@RequestParam("file") MultipartFile file) throws TesseractException, IOException {return weChatService.ocr(file);
}

4、定义service

@Resource
private Tesseract tesseract;@Override
public String ocr(MultipartFile file) throws TesseractException, IOException {InputStream sbs = new ByteArrayInputStream(file.getBytes());BufferedImage bufferedImage = ImageIO.read(sbs);return tesseract.doOCR(bufferedImage);
}

5、将官方的简体中文训练数据(后缀为.traineddata的文件)放到配置的目录(D:/tessdata)下

下边是官方训练数据的下载地址,打开后可以找到简体中文的文件 chi_sim.traineddata,下载下来放到指定位置就可以了

tess4j官方训练数据下载icon-default.png?t=N7T8https://digi.bib.uni-mannheim.de/tesseract/tessdata_fast/6、测试效果

测试图片

postman调用

可以发现【霜】被识别成了【需】,说明还是有一定的误差

http://www.lryc.cn/news/273099.html

相关文章:

  • 【Scala 】注解
  • 数通基础知识总结
  • 机器学习深度学习面试笔记
  • 安卓和Android是两种不同的操作系统?
  • Java学习——设计模式——结构型模式2
  • 什么是Maven ??? (以及关于依赖,中央仓库,国内源)
  • c++期末考题笔试来咯
  • 目标检测篇:如何根据xml标注文件生成类别classes的json文件
  • spring见解2基于注解的IOC配置
  • Uncaught TypeError: Cannot read property ‘snj‘ of null
  • Jenkins基础教程
  • 嵌入式C语言--WatchDog最全概念
  • 数据结构【树篇】(二)
  • 2024上海城博会|上海国际城市与建筑博览会-官 网
  • Dockerfile - 基于 SpringBoot 项目自定义镜像(项目上线全过程)
  • 论文查重降重写成大白话可以吗
  • 【WPF.NET开发】WPF中的命令
  • 怎么将epub转换成txt文件?
  • Java单词排序
  • Moonsong Labs与Web3演变
  • 流媒体学习之路(WebRTC)——GCC分析(4)
  • k8s持久化存储(NFS-StorageClass)
  • java servlet软件缺陷库管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目
  • 19|BabyAGI:根据气候变化自动制定鲜花存储策略
  • 面试经典150题(62-64)
  • 流量困境下,2024年餐饮商家的直播带货生意到底怎么做?
  • C++ 具名要求-基本概念-指定该类型对象可以默认构造
  • T527 Android13遥控适配
  • 第三部分使用脚手架:vue学习(61-65)
  • 【Linux学习笔记】解析Linux系统内核:架构、功能、工作原理和发展趋势