当前位置: 首页 > article >正文

轻松识别文字,这款Python OCR库支持超过80种语言

OCR是什么?

有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。

所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。

OCR的全称叫作“Optical Character Recognition”,即光学字符识别。

这算是生活里最常见、最有用的AI应用技术之一。

细心观察便可发现,身边到处都是OCR的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。

OCR本质是图像识别,其包含两大关键技术:文本检测和文字识别。

先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。

关于EasyOCR

Python中有一个不错的OCR库-EasyOCR,在GitHub已有9700star。它可以在python中调用,用来识别图像中的文字,并输出为文本。

https://github.com/JaidedAI/EasyOCR

EasyOCR支持超过80种语言的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,未来会支持更多的语言。

安装EasyOCR

安装过程比较简单,使用pip或者conda安装。

pip install easyocr

如果用的PyPl源,安装起来可能会耽误些时间,建议大家用清华源安装,几十秒就能安装好。

使用方法

EasyOCR的用法非常简单,分为三步:

  • 1.创建识别对象;
  • 2.读取并识别图像;
  • 3.导出文本。

我们先来举个简单的例子。

找一张路标图片,保存到电脑:

接着撸代码:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en']) 
# 读取图像
result = reader.readtext('test.jpg')
# 结果
result

输出结果:

可以看到路标上的三个路名以及拼音都识别出来了!

识别的结果包含在元组里,元组由三部分组成:边框坐标、文本、识别概率。

关于语言:

这段代码有一段参数[‘ch_sim’,‘en’],这是要识别的语言列表,因为路牌里有中文和英文,所以列表里添加了ch_sim(简体中文)、en(英文)。

可以一次传递多种语言,但并非所有语言都可以一起使用。英语与每种语言兼容,共享公共字符的语言通常相互兼容。

前文我们给出了EasyOCR支持的语言列表,并附有参数代号。

关于图像文件:

上面传入了相对路径’test.jpg’,还可以传递OpenCV图像对象(numpy数组)、图像字节文件、图像URL。

再读取一张文字较多的新闻稿图片:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en']) 
# 读取图像
result = reader.readtext('test1.jpg')
# 结果
result

识别文字的准确率还是很高的,接下来对文字部分进行抽取。

for i in result:word = i[1]print(word)

输出:

小结

该开源库是作者研究了几篇论文,复现出来的成果,真是一位实干家。

检测部分使用了CRAFT算法,识别模型为CRNN,它由3个主要组件组成:特征提取,序列标记(LSTM)和解码​​(CTC)。整个深度学习过程基于Pytorch实现。

作者一直在完善EasyOCR,后续计划一方面扩展支持更多的语言,争取覆盖全球80%~90%的人口;另一方面支持手写识别,并提高处理速度。

http://www.lryc.cn/news/2418569.html

相关文章:

  • [ldap]ldap server安装以及图形化操作
  • 【面试题】网站或者APP页面显示空白如何排查
  • 边框(Border) 和 轮廓(Outline) 属性
  • 由Codebehind所引发的
  • Oracle 11g R2(11.2.0.4.0)+udev搭建RAC
  • SQL Server数据库被置疑的解决方案
  • HTTP Status 404 的详细解决思路
  • javascript:图片切换特效
  • 用Qt写软件系列一:QCacheViewer(浏览器缓存查看器)
  • zblog主题模板:响应式企业模板宽屏企业主题
  • 电子技术——BJT放大器基础
  • 学习笔记之C++ How to Program(part)
  • 21点,简单的纸牌游戏——C++编写
  • Microsoft Visio 2010密钥
  • qq密码自动测试软件,QQ2004测试版密码获取演示
  • linux 溢出漏洞,Linux-glibc溢出漏洞(CVE-2015-0235)
  • 线性移位寄存器序列(m序列)之MATLAB实现
  • 网络流入门级学习报告(中)
  • EasyAR 插件使用简介
  • WorldWind学习系列:2、基本流程
  • 20 个 优秀源码下载网站
  • 一个不错的选色网站 color picker
  • 远程控制---实验九:IPC远程植入木马
  • 软件需求规格说明书样例
  • 多媒体技术选择题
  • 加密解密基础、PKI及SSL、创建私有CA
  • 垃圾短信多,你的手机可能被监控了!
  • 干货:上网行为网络管理系统推荐(2024年最强行为管理软件)
  • L2TP client主动发起详解(含抓包)
  • 应用软件保护方法