当前位置: 首页 > news >正文

Python 实现:OCR在图片中提取文字(基于Gradio实现)

Paddle OCR

PaddleOCR 基于深度学习技术实现的,使用十分简单。

先看效果

在这里插入图片描述
在这里插入图片描述

可以看出来识别效果还是不错的,里面的“湿”字识别成了繁体字。如果不是连体字,就不会出现这个问题。

1.测试环境

操作系统:Win10
Python:3.10

2.安装PaddlePaddle库

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple(自行选择镜像源)

3.下载PaddleOCR库

git clone https://github.com/PaddlePaddle/PaddleOCR

也可以选择直接DownLoad下载文件解压到本地

4.安装依赖包

进入PaddleOCR文件夹下:

> cd PaddleOCR

安装第三方依赖:

pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

5.详细代码

from pprint import pprint  
from paddleocr import PaddleOCR  
import gradio as gr  ocr = PaddleOCR(use_angle_cls=True, lang="ch")  def process(image):  result = ocr.ocr(image)  # return resultoutput_text = ""  # 初始化输出文本变量for sublist in result:for line in sublist:text = line[1][0]  # 提取文本output_text += text + "\n"  # 将文本追加到输出文本变量,并添加换行符pprint(output_text)return output_textiface = gr.Interface(fn=process, inputs="image", outputs="text",title="图片OCR提取文字", iface.launch()  

注意:这里result原先返回的还有坐标信息以及置信度,这里经过处理只返回了识别后的文本信息。如果需要坐标信息,可以直接返回result。

http://www.lryc.cn/news/260020.html

相关文章:

  • idea插件开发报错: ZipException opening “slf4j.jar“: zip END header not found
  • 【Linux】多线程编程
  • 【Mysql】InnoDB的表空间(九)
  • 【09】ES6:Set 和 Map 数据结构
  • Java通过documents4j和libreoffice把word转为pdf
  • 物联网时代的访问控制研究综述
  • 【产品经理】需求池和版本树
  • Qt图像处理-OpenCv中Mat与QImage互转
  • 构建外卖小程序:技术代码实践
  • IDEA中显示方法、类注释信息
  • 《数据结构、算法与应用C++语言描述》- 堆排序 - 借助priority_queue的C++实现
  • 10.CSS浮动
  • Angular 2 学习笔记
  • xcode 修改 target 中设备朝向崩溃
  • ZLMediaKit 编译以及测试(Centos 7.9 环境)
  • 汽车清除积碳和清洗节气门
  • RocketMQ 总体概括
  • 使用qemu在arm上模拟x86并运行docker
  • IIS配置多域名跨域
  • el-form表单校验输入框值为0时 提示校验不通过
  • Vue3后台管理-项目总结
  • 利用Pytorch预训练模型进行图像分类
  • MSF学习
  • Mybatis与Spring结合深探——MapperFactoryBean的奥秘
  • processon使用及流程图和泳道图的绘画(登录界面流程图,门诊流程图绘制门诊泳道图,住院泳道图,OA会议泳道图),Axure自定义元件
  • 【虹科干货】关于JSON数据库
  • 区块链的可拓展性研究【03】扩容整理
  • golang学习笔记——互斥锁sync.Mutex、计数器sync.WaitGroup、读写锁sync.RWMutex
  • MFC 加载本地文件设置图标
  • 飞天使-linux操作的一些技巧与知识点6-ansible结合jinja2使用,可规范化进行自动化管控