当前位置：首页 > news >正文

Tesseract-OCR 控制台怎么使用

news 2025/8/11 15:09:10

Tesseract-OCR 控制台是一个命令行工具，可以在 Windows、Linux、macOS 等操作系统中使用。下面是使用 Tesseract-OCR 控制台进行文字识别的基本步骤：

安装 Tesseract-OCR：可以到 Tesseract-OCR 的官方网站（https://github.com/tesseract-ocr/tesseract）下载相应版本的 Tesseract-OCR 安装包，然后进行安装。

进入 Tesseract-OCR 目录：在命令提示符窗口中，使用“cd”命令进入 Tesseract-OCR 的安装目录。例如，如果 Tesseract-OCR 安装在 C:\Program Files\Tesseract-OCR 目录下，那么可以使用以下命令进入该目录：

cd C:\Program Files\Tesseract-OCR

tesseract [image_path][output_file][-l lang][--psm page_seg_mode][--oem ocr_engine_mode]

其中，“image_path”是要识别的图片的路径，“output_file”是识别结果的输出文件名，“lang”是识别语言，默认为英语（eng），也可以设置为其他语言的缩写，例如中文（chi_sim）。“--psm”和“--oem”是可选参数，分别用于设置页面分割模式和 OCR 引擎模式。

例如，要识别一张名为“test.png”的图片，并将识别结果保存到名为“result.txt”的文本文件中，可以使用以下命令：

tesseract test.png result -l eng

sqlCopy codetesseract test.png result-l eng

这个命令会将图片“test.png”中的文字识别出来，并保存到“result.txt”中。

以上就是在 Windows 环境下使用 Tesseract-OCR 控制台进行文字识别的基本步骤。需要注意的是，在进行文字识别时，最好对图片进行预处理，以提高识别率。