当前位置：首页 > news >正文

PHP将pdf转为图片后用OCR识别

news 2025/9/11 13:50:13

1.确保apt包是最新

sudo apt update

2.使用apt安装

sudo apt install tesseract-ocr

3.检查版本

tesseract --version

4.pdf转成图片，这边需要安装imagick插件

$pdf = new Imagick();
$pdf->setResolution(150, 150);
$pdf->readImage('.'.$temp);
$pdf->setImageFormat('png'); // 转换为PNG图像格式

// 引入 Tesseract OCR 类
use thiagoalessio\TesseractOCR\TesseractOCR;// 创建 Tesseract OCR 对象
$ocr = new TesseractOCR();// 设置要识别的图像文件路径
$ocr->image('path/to/image.jpg');// 运行 OCR 识别
$text = $ocr->run();// 输出识别结果
echo $text;

代码不连贯，不是一个完整的例子。先做备忘

http://www.lryc.cn/news/222912.html

相关文章：

IDEA 函数下边出现红色的波浪线，提示报错

Discourse 如何在 header 上添加 HTML

[深入理解SSD] 总目录

kubernetes集群编排（7）

mfc 下的OpenGL

机器翻译目前广泛应用于文档翻译以及硬件翻译

木材加工工厂数字孪生可视化管理平台，赋能传统木材制造业数字化高质转型

企业级低代码开发，科技赋能让企业具备“驾驭软件的能力”

在WSL2中安装多个Ubuntu实例

java--实体javaBean

重温设计模式之什么是设计模式？

CSS关于默认宽度

LeetCode----149. 直线上最多的点数

19、Flink 的Table API 和 SQL 中的自定义函数及示例（3）

Flutter IOS 前后台切换主题自动变化的问题

rabbitmq入门学习

说说对Fiber架构的理解？解决了什么问题？

Spring Security笔记

快速教程｜如何在 AWS EC2上使用 Walrus 部署 GitLab

[vmware]vmware虚拟机压缩空间清理空间

一篇文章带你使用（MMKV--基于 mmap 的高性能通用 key-value 组件）

Pytorch 里面torch.no_grad 和model.eval(), model.train() 的作用

Ozon产品内容评级功能上线，妙手ERP实力助力Ozon卖家全方位打造爆款产品！

Linux 下最主流的文件系统格式——ext

变量环境、变量提升和暂时性死区

yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计（代码+教程）

【神经网络】【GoogleNet】

网络安全深入学习第八课——正向代理（工具：ReGeorg）

Jmeter全流程性能测试实战