当前位置: 首页 > news >正文

PHP将pdf转为图片后用OCR识别

1.确保apt包是最新

sudo apt update

2.使用apt安装

sudo apt install tesseract-ocr

 3.检查版本

tesseract --version

 4.pdf转成图片,这边需要安装imagick插件

$pdf = new Imagick();
$pdf->setResolution(150, 150);
$pdf->readImage('.'.$temp);
$pdf->setImageFormat('png'); // 转换为PNG图像格式
// 引入 Tesseract OCR 类
use thiagoalessio\TesseractOCR\TesseractOCR;// 创建 Tesseract OCR 对象
$ocr = new TesseractOCR();// 设置要识别的图像文件路径
$ocr->image('path/to/image.jpg');// 运行 OCR 识别
$text = $ocr->run();// 输出识别结果
echo $text;

 代码不连贯,不是一个完整的例子。先做备忘

http://www.lryc.cn/news/222912.html

相关文章:

  • IDEA 函数下边出现红色的波浪线,提示报错
  • Discourse 如何在 header 上添加 HTML
  • [深入理解SSD] 总目录
  • kubernetes集群编排(7)
  • mfc 下的OpenGL
  • 机器翻译目前广泛应用于文档翻译以及硬件翻译
  • 木材加工工厂数字孪生可视化管理平台,赋能传统木材制造业数字化高质转型
  • 企业级低代码开发,科技赋能让企业具备“驾驭软件的能力”
  • 在WSL2中安装多个Ubuntu实例
  • java--实体javaBean
  • 重温设计模式之什么是设计模式?
  • CSS关于默认宽度
  • JDBC(二)
  • LeetCode----149. 直线上最多的点数
  • 19、Flink 的Table API 和 SQL 中的自定义函数及示例(3)
  • Flutter IOS 前后台切换主题自动变化的问题
  • rabbitmq入门学习
  • 说说对Fiber架构的理解?解决了什么问题?
  • Spring Security笔记
  • 快速教程|如何在 AWS EC2上使用 Walrus 部署 GitLab
  • [vmware]vmware虚拟机压缩空间清理空间
  • 一篇文章带你使用(MMKV--基于 mmap 的高性能通用 key-value 组件)
  • Pytorch 里面torch.no_grad 和model.eval(), model.train() 的作用
  • Ozon产品内容评级功能上线,妙手ERP实力助力Ozon卖家全方位打造爆款产品!
  • Linux 下最主流的文件系统格式——ext
  • 变量环境、变量提升和暂时性死区
  • yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计(代码+教程)
  • 【神经网络】【GoogleNet】
  • 网络安全深入学习第八课——正向代理(工具:ReGeorg)
  • Jmeter全流程性能测试实战