当前位置: 首页 > news >正文

【OCR】 - Tesseract OCR在mac系统中安装

Tesseract OCR

在Mac环境下安装Tesseract OCR(Optical Character Recognition)通常可以通过Homebrew包管理器进行。以下是安装步骤:

安装Homebrew

如果你还没有安装Homebrew,请访问 https://brew.sh/ 并按照页面上的说明安装。

使用Homebrew安装Tesseract

  1. 打开终端(Terminal)应用程序。
  2. 在终端中输入以下命令以安装Tesseract:
brew install tesseract

这将下载并安装最新版本的Tesseract,同时可能还会安装一些依赖项。

安装语言包

要在Mac上下载Tesseract的简体中文语言数据包(chi_sim.traineddata),你可以按照以下步骤进行操作:

下载语言数据包

  1. 访问Tesseract官方镜像站点之一:https://github.com/tesseract-ocr/tessdata_fast 或 https://github.com/tesseract-ocr/tessdata_best
  2. 在GitHub页面上,找到并点击“Clone or download”按钮,然后选择“Download ZIP”来下载整个项目。
  3. 解压缩下载的ZIP文件,你会看到一个名为 tessdata

安装语言数据包

  • 1.找到Tesseract在Mac上的安装位置。通常情况下,如果你使用Homebrew安装,它可能位于
    /usr/local/Cellar/tesseract/版本号/share/tessdata
  • 2.将解压后的
    tessdata
    chi_sim.traineddata
    tessdata

验证安装

1.打开终端(Terminal)应用程序。
2.输入以下命令以验证是否已经正确安装了Tesseract和简体中文语言数据包:

tesseract --version

这将显示你当前安装的Tesseract版本信息。
3.检查可用的语言列表:

tesseract --list-langs

如果一切正常,你应该能在输出列表中看到chi_sim。
现在,你就可以使用Tesseract识别简体中文图像了。

http://www.lryc.cn/news/277436.html

相关文章:

  • 了解不同方式导入导出的速度之快
  • 2024年第九届计算机与通信系统国际会议(ICCCS2024) ,邀您相约西安!
  • 获取直播间的最新评论 - python 取两个list的差集
  • 2023年度总结:但行前路,不负韶华
  • 智数融合|低代码入局,推动工业数字化转型走"深"向"实"
  • 初学者的基本 Python 面试问题和答案
  • 支持向量机(Support Vector Machines,SVM)
  • golang一个轻量级基于内存的kv存储或缓存
  • henauOJ 1103: 统计元音
  • 虚幻引擎:开创视觉与创意的新纪元
  • T527 Android 13 编译步骤
  • OpenAI ChatGPT-4开发笔记2024-04:Chat之Tool之2:multiple functions
  • 14:00面试,14:07就出来了,问的问题有点变态。。。
  • 206. 反转链表(Java)
  • LeetCode 2807. 在链表中插入最大公约数【链表,迭代,递归】1279
  • Hive之set参数大全-3
  • Golang拼接字符串性能对比
  • 【问题解决】web页面html锚点定位后内容被遮挡问题解决【暗锚】
  • easyui datagrid无数据时显示无数据
  • 动态规划python简单例子-斐波那契数列
  • 免 费 搭 建 多模式商城:b2b2c、o2o、直播带货一网打尽
  • Python AttributeError: ‘NoneType‘ object has no attribute ‘shape‘如何解决
  • vue3自定义确认密码匹配验证规则
  • 岗位所处定位,岗位职责
  • 2024阿里云服务器配置推荐方案
  • OceanBase原生分布式数据库
  • 首次使用go-admin
  • 软件工程概论---内聚性和耦合性
  • 纯血鸿蒙「扩圈」100天,酝酿已久的突围
  • UICollection Compositional Layout全详解