当前位置: 首页 > news >正文

深度学习系列59:文字识别

1. 简单文本:

使用google加的tesseract,效果不错。
首先安装tesseract,在mac直接brew install即可。
python调用代码:

import pytesseract
from PIL import Image
img = Image.open('1.png')
pytesseract.image_to_string(img, lang='chi_sim+eng')

2. 结构化文本

使用百度家的paddleocr可以达成如下效果:
在这里插入图片描述

安装方法:pip install “paddleocr>=2.2”,调用代码。
其中画图的部分如果要用的话,需要下载字体库:!git clone https://gh.api.99988866.xyz/https://github.com/PaddlePaddle/PaddleOCR;不需要画图的话,注释掉即可。

import os
import cv2
from paddleocr import PPStructure, draw_structure_result, save_structure_res
from PIL import Imagedef Structure_analysis(img_path):table_engine = PPStructure(show_log=True)save_folder = './output/table'img = cv2.imread(img_path)result = table_engine(img)1save_structure_res(result, save_folder,os.path.basename(img_path).split('.')[0])for line in result:line.pop('img')print(line)font_path = '../PaddleOCR/doc/fonts/simfang.ttf' # PaddleOCR下提供字体包image = Image.open(img_path).convert('RGB')im_show = draw_structure_result(image, result, font_path=font_path)im_show = Image.fromarray(im_show)im_show.save('result.jpg')passStructure_analysis('1.png')
http://www.lryc.cn/news/306580.html

相关文章:

  • 学习JAVA的第七天(基础)
  • GoLand 相关
  • 顶顶通呼叫中心中间件-如何使处于机器人话术中的通话手动转接到坐席分机上
  • RabbitMQ开启MQTT协议支持
  • Orange3数据预处理(列选择组件)数据角色及类型描述
  • c sharp资料
  • 《低功耗方法学》翻译——第十四章:电源切换网络设计
  • 如何使用Axure RP制作web页面并实现无公网ip远程访问——“cpolar内网穿透”
  • vue2实现无感刷新token
  • 每日学习-2月18日
  • AI 使人机交互发生根本性转变 AI芯片主战场,变了
  • 容器库(12)-std::unordered_multiset
  • Mysql学习之事务日志undolog深入剖析
  • springboot整合druid及可能遇到的问题
  • c++文件的打开、读写和关闭。缓冲区的使用和控制。
  • 网络层的DDoS攻击与应用层的DDoS攻击之间的区别
  • Windows系统安全策略设置之本地NTLM重放提权
  • AI云增强升级!还原生动人像,拍出质感照片
  • PHP WebSocket:技术解析与实用指南
  • K8S实战:Centos7部署Kubernetes1.24.0集群
  • webpack的使用(中)
  • matlab经验模式分解的R波检测算法
  • win10编译openjdk源码
  • mysql 自定义函数create function
  • 【析】装卸一体化车辆路径问题的自适应并行遗传算法
  • react项目中的redux以及react-router-dom
  • django学习网址
  • @ 代码随想录算法训练营第4周(C语言)|Day21(二叉树)
  • Android的消息机制--Handler
  • 获取用户信息与token理解