当前位置: 首页 > news >正文

【PaddleOCR】PaddlePaddle 3.0环境安装,及PaddleOCR3.0 快速入门使用

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者,提供AI相关的技术咨询、项目开发和个性化解决方案等服务,如有需要请站内私信或者联系任意文章底部的的VX名片(ID:xf982831907

💬 博主粉丝群介绍:① 群内初中生、高中生、本科生、研究生、博士生遍布,可互相学习,交流困惑。② 热榜top10的常客也在群里,也有数不清的万粉大佬,可以交流写作技巧,上榜经验,涨粉秘籍。③ 群内也有职场精英,大厂大佬,可交流技术、面试、找工作的经验。④ 进群免费赠送写作秘籍一份,助你由写作小白晋升为创作大佬。⑤ 进群赠送CSDN评论防封脚本,送真活跃粉丝,助你提升文章热度。有兴趣的加文末联系方式,备注自己的CSDN昵称,拉你进群,互相学习共同进步。

在这里插入图片描述

【PaddleOCR】PaddlePaddle 3.0环境安装,及PaddleOCR3.0 快速入门使用

    • 一、概述
    • 二、安装 PaddlePaddle
      • 2.1 CPU 环境安装
      • 2.2 GPU 环境安装
    • 三、安装 PaddleOCR
    • 四、命令行使用
    • 五、Python 脚本使用
    • 六、输出示例
    • 七、结语

一、概述

  PaddleOCR 是一款强大的开源 OCR(光学字符识别)工具包,具有高精度、多语言支持和良好的扩展性。本文将指导您如何快速安装和使用 PaddleOCR,包括环境准备和基本的文本识别操作。

二、安装 PaddlePaddle

  在开始使用 PaddleOCR 之前,您需要先安装 PaddlePaddle 框架。PaddlePaddle 是百度推出的深度学习平台,PaddleOCR 基于此框架构建。

2.1 CPU 环境安装

  如果您没有 NVIDIA GPU 或者不想使用 GPU 加速,可以安装 CPU 版本的 PaddlePaddle:

python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

2.2 GPU 环境安装

  如果您有 NVIDIA GPU 并希望利用 GPU 加速,您需要根据您的 CUDA 版本安装相应的 PaddlePaddle GPU 版本。以下是安装 CUDA 11.8 版本的示例:

python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

三、安装 PaddleOCR

  在成功安装 PaddlePaddle 后,可以继续安装 PaddleOCR:

pip install paddleocr

四、命令行使用

  安装完成后,您可以通过命令行直接使用 PaddleOCR。以下是一个简单的命令行示例,用于执行文本检测和识别:

paddleocr ocr -i ./general_ocr_002.png --use_doc_orientation_classify False --use_doc_unwarping False --use_textline_orientation False

五、Python 脚本使用

  您也可以在 Python 脚本中导入 PaddleOCR 并使用其 API 进行更复杂的应用开发。

from paddleocr import PaddleOCR# 创建 PaddleOCR 对象
ocr = PaddleOCR(use_doc_orientation_classify=False, use_doc_unwarping=False, use_textline_orientation=False
)
# ocr = PaddleOCR(use_doc_orientation_classify=True, use_doc_unwarping=True) # 文本图像预处理+文本检测+方向分类+文本识别
# ocr = PaddleOCR(use_doc_orientation_classify=False, use_doc_unwarping=False) # 文本检测+文本行方向分类+文本识别
# ocr = PaddleOCR(
#     text_detection_model_name="PP-OCRv5_mobile_det",
#     text_recognition_model_name="PP-OCRv5_mobile_rec",
#     use_doc_orientation_classify=False,
#     use_doc_unwarping=False,
#     use_textline_orientation=False) # 更换 PP-OCRv5_mobile 模型
# 执行预测
result = ocr.predict("./general_ocr_002.png")# 输出结果
for res in result:res.print()res.save_to_img("output")res.save_to_json("output")

六、输出示例

  以下是 PaddleOCR 输出结果的示例,包含检测到的文本、位置信息和置信度等:

{'res': {'input_path': '/root/.paddlex/predict_input/general_ocr_002.png','page_index': None,'model_settings': {'use_doc_preprocessor': True,'use_textline_orientation': False},'doc_preprocessor_res': {'input_path': None,'page_index': None,'model_settings': {'use_doc_orientation_classify': False,'use_doc_unwarping': False},'angle': -1},'dt_polys': array([[[  3,  10], ...]], dtype=int16),'text_det_params': {'limit_side_len': 736,'limit_type': 'min','thresh': 0.3,'max_side_limit': 4000,'box_thresh': 0.6,'unclip_ratio': 1.5},'text_type': 'general','textline_orientation_angles': array([-1, ..., -1]),'text_rec_score_thresh': 0.0,'rec_texts': ['www.997700', 'Cm', '登机牌', 'BOARDING', 'PASS', ...],'rec_scores': array([0.67582953, ..., 0.97418666]),'rec_polys': array([[[  3,  10], ...]], dtype=int16),'rec_boxes': array([[  3, ...,  30], ..., [ 99, ..., 479]], dtype=int16)}
}

  PaddleOCR3.0预处理的图片展示如下:
在这里插入图片描述
  PaddleOCR3.0的检测结果如下:
在这里插入图片描述

七、结语

  通过以上步骤,您现在已经成功安装并开始使用 PaddleOCR 进行文本识别。PaddleOCR 提供了丰富的功能和灵活的配置选项,适用于各种文本识别场景。您可以根据实际需求进一步探索和定制 PaddleOCR 的功能。

http://www.lryc.cn/news/576853.html

相关文章:

  • 企业级路由器技术全解析:从基础原理到实战开发
  • 学习使用Visual Studio分析.net内存转储文件的基本用法
  • cJSON 使用方法详解
  • 华为云 Flexus+DeepSeek 征文|华为云 Flexus 云服务 Dify-LLM 平台深度部署指南:从基础搭建到高可用实践
  • NLP随机插入
  • 如果将Word里每页的行数设置成50行
  • jenkins启动报错,一直无法启动
  • 高并发电商返利 APP 架构设计:从淘客佣金模型到分布式导购系统的技术落地
  • [分布式并行] 流水线并行 PP(NaivePP/GPipe/F-then-B/PipeDream/1F1B)
  • MySQL数据库的增删改查
  • 茶叶根茎分割数据集介绍与应用
  • RNN人名分类器案例
  • Android大图加载优化:BitmapRegionDecoder深度解析与实战
  • Ubuntu20 编译安装 Redis7.2.4
  • SAP顾问职位汇总(第26周)
  • 大模型岗位面试常见问题及解答
  • python+uniapp基于微信小程序的多人协同办公系统
  • 人工智能之数学基础:如何判断正定矩阵和负定矩阵?
  • chapter02_AbstractBeanfactory与模板方法
  • python sklearn 机器学习(1)
  • Ragflow本地部署和基于知识库的智能问答测试
  • 【Typst】自定义彩色盒子
  • 医疗AI智能基础设施构建:向量数据库矩阵化建设流程分析
  • 如何搭建基于RK3588的边缘服务器集群?支持12个RK3588云手机
  • Qt QGraphics简述及例程 - QGraphicsView、QGraphicsScene和QGraphicsItem
  • 深入剖析Nacos服务发现与注册,及如何基于LoadBalancer实现负载均衡
  • #华为昇腾#华为计算#昇腾开发者计划2025#
  • Redis分布式锁核心原理源码
  • #华为鲲鹏#华为计算#鲲鹏开发者计划2025#
  • Transformer结构与代码实现详解