当前位置：首页 > news >正文

Python 实现：OCR在图片中提取文字（基于Gradio实现）

news 2025/7/21 13:02:10

Paddle OCR

PaddleOCR 基于深度学习技术实现的，使用十分简单。

先看效果

在这里插入图片描述

可以看出来识别效果还是不错的，里面的“湿”字识别成了繁体字。如果不是连体字，就不会出现这个问题。

1.测试环境

操作系统：Win10
Python：3.10

2.安装PaddlePaddle库

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple（自行选择镜像源）

3.下载PaddleOCR库

git clone https://github.com/PaddlePaddle/PaddleOCR

也可以选择直接DownLoad下载文件解压到本地

4.安装依赖包

进入PaddleOCR文件夹下：

> cd PaddleOCR

安装第三方依赖：

pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

5.详细代码

from pprint import pprint  
from paddleocr import PaddleOCR  
import gradio as gr  ocr = PaddleOCR(use_angle_cls=True, lang="ch")  def process(image):  result = ocr.ocr(image)  # return resultoutput_text = ""  # 初始化输出文本变量for sublist in result:for line in sublist:text = line[1][0]  # 提取文本output_text += text + "\n"  # 将文本追加到输出文本变量，并添加换行符pprint(output_text)return output_textiface = gr.Interface(fn=process, inputs="image", outputs="text",title="图片OCR提取文字", iface.launch()

注意：这里result原先返回的还有坐标信息以及置信度，这里经过处理只返回了识别后的文本信息。如果需要坐标信息，可以直接返回result。

http://www.lryc.cn/news/260020.html

相关文章：

idea插件开发报错: ZipException opening “slf4j.jar“: zip END header not found

【Linux】多线程编程

【Mysql】InnoDB的表空间（九）

【09】ES6：Set 和 Map 数据结构

Java通过documents4j和libreoffice把word转为pdf

物联网时代的访问控制研究综述

【产品经理】需求池和版本树

Qt图像处理-OpenCv中Mat与QImage互转

构建外卖小程序：技术代码实践

IDEA中显示方法、类注释信息

《数据结构、算法与应用C++语言描述》- 堆排序 - 借助priority_queue的C++实现

Angular 2 学习笔记

xcode 修改 target 中设备朝向崩溃

ZLMediaKit 编译以及测试(Centos 7.9 环境)

汽车清除积碳和清洗节气门

RocketMQ 总体概括

使用qemu在arm上模拟x86并运行docker

IIS配置多域名跨域

el-form表单校验输入框值为0时提示校验不通过

Vue3后台管理-项目总结

利用Pytorch预训练模型进行图像分类

Mybatis与Spring结合深探——MapperFactoryBean的奥秘

processon使用及流程图和泳道图的绘画（登录界面流程图，门诊流程图绘制门诊泳道图，住院泳道图，OA会议泳道图），Axure自定义元件

【虹科干货】关于JSON数据库

区块链的可拓展性研究【03】扩容整理

golang学习笔记——互斥锁sync.Mutex、计数器sync.WaitGroup、读写锁sync.RWMutex

MFC 加载本地文件设置图标

飞天使-linux操作的一些技巧与知识点6-ansible结合jinja2使用，可规范化进行自动化管控