当前位置: 首页 > news >正文

Tesseract开源的OCR工具及python pytesseract安装使用

一 、介绍

Tesseract是一款由Google赞助的开源OCR。 pytesseract是python包装器,它为可执行文件提供了pythonic API。

Tesseract 已经有 30 年历史,开始它是惠普实验室的一款专利软件,在2005年后由Google接手并进一步开发和完善。Tesseract支持多种语言文字的检测和识别,包括中文、英语、德语、法语、意大利语等多种主要语言,同时也支持针对特定场景或应用的领域OCR开发。

Tesseract基于机器学习技术,使用了多层神经网络以及支持向量机(SVM)等算法进行文字特征提取和识别。同时,Tesseract通过图像预处理、二值化、斑点去除和边框检测等多个环节优化页面处理流程,并且提供了多种字体、大小、旋转角度和噪声等挑战场景下的训练数据集,使得识别精度可以获得不错的性能表现。

二、安装

1、python安装pytesseract

pip install pytesseract -i https://pypi.tuna.tsinghua.edu.cn/simple/

 2、python安装Pillow图片处理

pip install Pillow -i https://pypi.tuna.tsinghua.edu.cn/simple/

3、pytesseract需要和安装在本地的tesseract-ocr.exe文件一起使用

tesseract-ocr.exe 下载地址 github

根据你的操作系统,选择适当的版本进行下载和安装。安装勾选中文语言包

 4、系统变量path添加tesseract的安装路径xx:\Program Files\tesseract

系统变量path详细添加,或者遇到没有找到文件问题请看我的下一篇

三、使用

import pytesseract
from PIL import Image
#英文lang='eng'#中文:lang='chi_sim'#中英文混合:lang='chi_sim+eng'
text = pytesseract.image_to_string(Image.open(r"./img/a.jpg"), lang='eng')
print("英文:",text)

上述代码假设你有一个名为"a.png"的图像文件,它位于同级/img工作目录下。通过image_to_string()函数,将图像转换为文本,并将结果存储在text变量中。最后,可以使用print语句打印出识别的文本。

这就是使用Tesseract及pytesseract进行OCR的基本步骤。你可以根据自己的需求进一步探索和调整代码。

http://www.lryc.cn/news/100800.html

相关文章:

  • 【数理知识】自由度 degree of freedom 及自由度的计算方法
  • 苍穹外卖day09——历史订单模块(用户端)+订单管理模块(管理端)
  • 正则表达式 —— Grep
  • STC12C5A系列单片机片内看门狗的应用
  • C语言指针详解
  • RTPS规范v2.5(中文版)
  • LeetCode102.Binary-Tree-Level-Order-Traversal<二叉树的层序遍历>
  • yolov8系列[五]-项目实战-yolov8模型无人机检测
  • Redis 笔记,基本数据类型、持久化、主从、集群等等问题
  • JDK,JRE,JVM三者的关系
  • 行为型-命令模式(Command Pattern)
  • 总结942
  • MFC自定义控件使用
  • 【学习笔记】「ROI 2018 Day 2」无进位加法
  • 分布式I/O,IT和OT融合少不了它
  • 主干网络篇 | YOLOv8 更换主干网络之 VanillaNet |《华为方舟实验室最新成果》
  • AD20. 如何给元器件设计、添加3D模型
  • C++笔记之vector的底层实现和扩容机制
  • JavaSE - Sting类
  • zotero+overleaf插入参考文献
  • C语言每天一练----输出水仙花数
  • Linux-Shell
  • Python读取csv、Excel文件生成图表
  • 虚拟机中Linux的IP地址配置详解
  • Codeforces Round 889 (Div. 2) 题解
  • 系统学习Linux-MySQL用户权限管理(三)
  • 【雕爷学编程】MicroPython动手做(02)——尝试搭建K210开发板的IDE环境4
  • 阿里云NVIDIA A100 GPU云服务器性能详解及租用费用
  • 数字身份、分布式存储、跨链技术等将如何推动Web3数据的发展?
  • Ubuntu 新增2T 硬盘,配置自动挂载