当前位置: 首页 > news >正文

【案例】python集成OCR识别工具调研

目录

  • 一、前言
  • 二、Tesseract_OCR
    • 2.1、安装过程
    • 2.2、python代码使用
  • 三、PaddleOCR
    • 3.1、安装过程
    • 3.2、python代码使用
  • 四、EasyOCR
  • 五、ddddOCR
  • 六、CnOCR
  • 七、总结

一、前言

因项目需要OCR识别能力,且要支持私有化部署。本文将对比市场一些开源的OCR识别工具,从中选择适合项目需要的OCR,且后续进一步研究/训练对应OCR模型。
主要OCR识别有:Tesseract_OCR、PaddleOCR、EasyOCR、dddd_ocr、CnOCR
备注说明:后面的图片测试使用如下
请添加图片描述

二、Tesseract_OCR

Pillow是一个免费开源的图像处理库,它可以用来读取、操作和保存各种各样的图片文件。Tesseract-OCR则是一个强大的光学字符识别引擎,可以离线识别,可以准确地识别图像中的文字,要配合本地安装tesseract-ocr.exe文件一起使用。
Tesseract-OCR特点:

  • Tesseract支持UTF-8编码格式,并且可以“开箱即用”地识别100多种语言
  • Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF等
  • 官方建议,为了获得更好的OCR结果,最好提供给高质量的图像
  • Tesseract进行识别其他语言的训练,具体的训练方式请参考官方提供的文档:https://tesseract-ocr.github.io/tessdoc/

2.1、安装过程

安装环境

http://www.lryc.cn/news/397794.html

相关文章:

  • 第一关:Linux基础知识
  • qt 自定义信号和槽举例
  • 编程语言与数据结构的关系:深度解析与探索
  • 了解AsyncRotationController
  • 有必要找第三方软件测评公司吗?如何选择靠谱软件测评机构?
  • 物联网系统中市电电量计量方案(一)
  • 2024年热门无线领夹麦克风哪款好,麦克风品牌排行榜前十名推荐
  • IEEE顶刊“放水”?稳居1区Top,发文扩张IF稳长,CCF推荐,审稿友好!
  • 发布:PhonePrompter_PC(手机录视频提词器_电脑版)
  • shein测试开发会问些啥?
  • mysql索引优化
  • Linux文件编程(打开/创建写入读取移动光标)
  • 集成测试技术栈
  • MongoDB - 集合和文档的增删改查操作
  • 【深度学习基础】安装包报错——MAC M3-MAX芯片安装scikit-learn库报错。
  • 【chatgpt消费者偏好】是什么驱动了游客持续旅游意愿?推文分享—2024-07-08
  • torchplus
  • LeetCode之最长回文子串
  • Gradle 介绍
  • 短视频矩阵:批量发布的秘密揭秘
  • 基于 Nginx + Spring Boot + Vue + JPA 的网站安全防护指南
  • Perl词法切分器:文本解析的瑞士军刀
  • 基于深度学习LightWeight的人体姿态之行为识别系统源码
  • Mac窗口辅助管理工具:Magnet for mac激活版
  • DWM 相关实现代码 [自用]
  • 根据样本数据的区域分布进行重采样
  • 数据库之MQL
  • LabVIEW平台从离散光子到连续光子的光子计数技术
  • 【Linux】Windows平台使用gdb调试FFmpeg源码
  • 提交表单form之后发送表单内容到指定邮箱(单php文件实现)