当前位置: 首页 > news >正文

【Python实战】如何优雅地实现文字 二维码检测?

前几篇,和大家分享了如何通过 Python 和相关库,自动化处理 PDF 文档,提高办公效率。

  • 【Python实战】自动化处理 PDF 文档,完美实现 WPS 会员功能
  • 【Python实战】如何优雅地实现 PDF 去水印?
  • 【Python实战】一键生成 PDF 报告,图文并茂,代码全公开

实操的同学发现,无论是 fitz 还是 PyPDF2 都无法搞定图片中的文字 & 二维码。

今天,继续给大家分享两个库,完美解决上述问题,亲测好用。

目录

  • 1. 文字检测-PPOCR
    • 1.1 安装
    • 1.2 调用
  • 2. 二维码检测-pyzbar
    • 2.1 安装
    • 2.2 调用
  • 写在最后

1. 文字检测-PPOCR

文字检测OCR(光学字符识别)广泛应用于文档数字化、自动化数据输入、车牌识别等领域。现代 OCR 利用深度学习和图像处理算法,能够处理各种字体和语言。随着 AI 的发展,OCR 的准确率和处理速度已近乎完美。

本文采用的是 PPOCR 这个库,来自百度飞桨团队,模型轻量,处理速度也相当感人。

1.1 安装

安装也非常简单,因为依赖 paddlepaddle,所以需要一并安装:

pip install paddlepaddle==2.6.1
pip install ppocr

1.2 调用

安装完成后,几行代码实现调用:

def img_ocr(img_path=None, img_data=None):if img_data is not None:img = img_dataelse:img = cv2.imread(img_path)result = ppocr.ocr(img, cls=True)[0]texts = []if result:for line in result:box = line[0]text = line[1][0]texts.append([text, box])return texts

注意:首次使用,paddleocr 会将模型下载到你的本地目录:C:\Users\xxx\.paddleocr\,后续使用将直接调用本地模型。

我们随便找一张图片来测试下:

将结果打印出来:

❌第二行出现了一个识别错误:江苏手机阅读显,把二维码识别成了,看来单纯靠 OCR 还是不太可靠😂~

✔️看来还得用 GPT 来排查一下文字错误。

2. 二维码检测-pyzbar

二维码应该说是一种标准化的信息存储方式,通常由黑白方块组成,广泛应用于支付、商品追踪和信息共享等场景。

展示在图像中,二维码检测具有非常显著的特点,但因为二维码形式多样,简单的图像处理方法无法很好地识别各种类型二维码。

这里我们采用 pyzbar 这个库,实现二维码检测。

2.1 安装

安装这里有个坑,尝试了两种方式,都无法调用成功。

一开始尝试 pip 安装:

pip install pyzbar

报错提示依赖库没有成功安装,尝试了 conda 安装:

conda install -c conda-forge pyzbar # 还是失败

最终在官方仓库中找到解决方案:需要安装 vcredist_x64.exe。

再次调用就没问题了。

2.2 调用

示例代码如下:

def qrcode_detect(image, left=0.12, right=1.12, top=0.15, bottom=1.25):gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)codes = decode(gray_image)results = [] for code in codes:x, y, w, h = code.rect.left, code.rect.top, code.rect.width, code.rect.heightresults.append([x, y, w, h])return image

codes 中包含了所有的二维码信息,包括二维码中编码的 url/文本等信息。

我们把检测结果打印出来看下:

写在最后

本文给大家带来了一种最简单的文字 & 二维码检测方法,亲测在白底黑字的文档场景中有效。

欢迎有其他解决方案的小伙伴,评论区交流下啊~

如果本文对你有帮助,欢迎点赞收藏备用。

http://www.lryc.cn/news/414952.html

相关文章:

  • 行为型设计模式3:模板方法/备忘录/解释器/迭代器
  • 思源笔记软件的优缺点分析
  • 追问试面试系列:Dubbo
  • 动手学深度学习V2每日笔记(卷积层)
  • qcom ucsi probe
  • flask和redis配合
  • 深度学习中的早停法
  • 科普文:JUC系列之多线程门闩同步器CountDownLatch的使用和源码
  • foreach循环和for循环在PHP中各有什么优势
  • 巧用casaos共享挂载自己的外接硬盘为局域网共享
  • 标题:解码“八股文”:助力、阻力,还是空谈?
  • 语言无界,沟通无限:2024年好用在线翻译工具推荐
  • 【Golang 面试 - 进阶题】每日 3 题(十八)
  • 二分+dp,CF 1993D - Med-imize
  • 三十种未授权访问漏洞复现 合集( 三)
  • 数据湖和数据仓库核心概念与对比
  • 探索WebKit的奥秘:打造高效、兼容的现代网页应用
  • 【leetcode】平衡二叉树、对称二叉树、二叉树的层序遍历(广度优先遍历)(详解)
  • 最短路径算法:Floyd-Warshall算法
  • 3DM游戏运行库合集离线安装包2024最新版
  • 【Bigdata】什么是混合型联机分析处理
  • Java 并发编程:volatile 关键字介绍与使用
  • 【Spark计算引擎----第三篇(RDD)---《深入理解 RDD:依赖、Spark 流程、Shuffle 与缓存》】
  • 四、日志收集loki+ promtail+grafana
  • xdma的linux驱动编译给arm使用(中断检测-测试程序)
  • 探索之路——初识 Vue Router:构建单页面应用的完整指南
  • 传输层_计算机网络
  • 自动驾驶的六个级别是什么?
  • 深度学习复盘与论文复现F
  • 如何学习自动化测试工具!