当前位置: 首页 > news >正文

Python OCR 使用easyocr库将图片中的文章提取出来

Python OCR 使用easyocr库将图片中的文章提取出来

  • 环境
    • 内容
      • 步骤一:安装easyocr库
      • 步骤二:导入必要的库
      • 步骤三:创建OCR阅读器对象
      • 步骤四:指定要识别的图片路径
      • 步骤五:执行OCR识别并提取文章内容
      • 步骤六:遍历识别结果并打印文章内容
    • 完整代码
    • 运行结果

EasyOCR是一个开源的Python库,专注于提供易用而准确的文字识别功能。它基于深度学习技术,使用了一种端到端的方法,能够在多种语言和字体下进行稳定的识别。

希望能写一些简单的教程和案例分享给需要的人

环境

Python 3.10.12
系统: ubuntu 22.04

内容

接下来我分享如何使用Python的easyocr库,将图片中的文字提取出来。

步骤一:安装easyocr库

首先,确保您已经安装了Python。接下来,我们需要安装easyocr库,可以通过以下命令在命令行中进行安装:

pip install easyocr

步骤二:导入必要的库

在您的Python脚本中,导入所需的库,其中包括我们即将使用的easyocr库:

import easyocr

步骤三:创建OCR阅读器对象

创建一个OCR阅读器对象,您可以选择要识别的语言。以下示例选择了中文和英文语言:

reader = easyocr.Reader(['ch_sim', 'en'])

步骤四:指定要识别的图片路径

将要进行OCR识别的图片放置在您选择的路径下,并将该路径赋值给变量image_path

image_path = 'test.png'

确保将test.png替换为您实际的图片路径。

步骤五:执行OCR识别并提取文章内容

使用OCR阅读器对象的readtext方法读取图片中的文本,将识别结果存储在变量results中:

results = reader.readtext(image_path)

步骤六:遍历识别结果并打印文章内容

使用循环遍历results中的每个识别结果,然后打印出每个结果的文本内容:

for (bbox, text, prob) in results:print(text)

完整代码

# 导入所需库
import easyocr# 创建一个OCR阅读器对象,选择中文和英文语言
reader = easyocr.Reader(['ch_sim', 'en'])# 指定要进行OCR识别的图片路径
image_path = 'aaa.png'# 使用OCR阅读器对象读取图片中的文本
results = reader.readtext(image_path)# 遍历识别结果并打印文本内容
for (bbox, text, prob) in results:print(text)

运行结果

在这里插入图片描述

python3 a.py

在这里插入图片描述
识别出来是这样:识别率还行,不过有些确实不是很正确。

盗理者
玛龄7年
企业员工
355
4954
1458
103万+
原创
屑#名
总排名
访问
1万+
1770
788
241
1071
讧论

在sublime text 的效果:

在这里插入图片描述

http://www.lryc.cn/news/143738.html

相关文章:

  • 门禁系统忘记登入密码,现在更换电脑如何迁移旧电脑门禁系统的数据
  • 初试Eureka注册中心
  • 【趣味随笔】怎么维护自己的电脑?
  • element 下拉组件获取对象
  • IDEA下SpringBoot指定环境、配置文件启动
  • python可视化matplotlib——绘制正弦和余弦
  • Day48|leetcode 198.打家劫舍、213.打家劫舍II、打家劫舍|||
  • Mysql001:Mysql概述以及安装
  • 如何调用api接口获取到商品数据
  • http请求方式过滤器与拦截器的区别
  • 大语言模型初学者指南 (2023)
  • 日常生活小技巧 -- 单位换算
  • 利用深度蛋白质序列嵌入方法通过 Siamese neural network 对 virus-host PPIs 进行精准预测【Patterns,2022】
  • opencv 车牌号的定位和识别+UI界面识别系统
  • 如何使用CSS实现一个自适应两栏布局,其中一栏固定宽度,另一栏自适应宽度?
  • 【PostgreSQL】导出数据库表(或序列)的结构和数据
  • Arcgis colorRmap
  • [JDK8环境下的HashMap类应用及源码分析] capacity实验
  • 【自动驾驶】TI SK-TDA4VM 开发板上电调试,AI Demo运行
  • 基于LOF算法的异常值检测
  • 软考-系统可靠性原理
  • 【Unity】【Amplify Shader Editor】ASE入门系列教程第二课 硬边溶解
  • 对神经网络理解的个人记录
  • 华为数通方向HCIP-DataCom H12-821题库(单选题:61-80)
  • Unity带有时效性的数据存储
  • vue 子组件 emit传递事件和事件数据给父组件
  • Zenity 简介
  • c# 数组反转
  • CSS学习笔记01
  • 数据结构,队列,顺序表队列,链表队列