当前位置：首页 > news >正文

【PaddleOCR】PaddlePaddle 3.0环境安装，及PaddleOCR3.0 快速入门使用

news 2025/6/30 9:30:24

🧑 博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）

💬 博主粉丝群介绍：① 群内初中生、高中生、本科生、研究生、博士生遍布，可互相学习，交流困惑。② 热榜top10的常客也在群里，也有数不清的万粉大佬，可以交流写作技巧，上榜经验，涨粉秘籍。③ 群内也有职场精英，大厂大佬，可交流技术、面试、找工作的经验。④ 进群免费赠送写作秘籍一份，助你由写作小白晋升为创作大佬。⑤ 进群赠送CSDN评论防封脚本，送真活跃粉丝，助你提升文章热度。有兴趣的加文末联系方式，备注自己的CSDN昵称，拉你进群，互相学习共同进步。

在这里插入图片描述

【PaddleOCR】PaddlePaddle 3.0环境安装，及PaddleOCR3.0 快速入门使用

- 一、概述
- 二、安装 PaddlePaddle
- - 2.1 CPU 环境安装
  - 2.2 GPU 环境安装
- 三、安装 PaddleOCR
- 四、命令行使用
- 五、Python 脚本使用
- 六、输出示例
- 七、结语

一、概述

PaddleOCR 是一款强大的开源 OCR（光学字符识别）工具包，具有高精度、多语言支持和良好的扩展性。本文将指导您如何快速安装和使用 PaddleOCR，包括环境准备和基本的文本识别操作。

二、安装 PaddlePaddle

在开始使用 PaddleOCR 之前，您需要先安装 PaddlePaddle 框架。PaddlePaddle 是百度推出的深度学习平台，PaddleOCR 基于此框架构建。

2.1 CPU 环境安装

如果您没有 NVIDIA GPU 或者不想使用 GPU 加速，可以安装 CPU 版本的 PaddlePaddle：

python -m pip install paddlepaddle==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/

2.2 GPU 环境安装

如果您有 NVIDIA GPU 并希望利用 GPU 加速，您需要根据您的 CUDA 版本安装相应的 PaddlePaddle GPU 版本。以下是安装 CUDA 11.8 版本的示例：

python -m pip install paddlepaddle-gpu==3.0.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

三、安装 PaddleOCR

在成功安装 PaddlePaddle 后，可以继续安装 PaddleOCR：

pip install paddleocr

四、命令行使用

安装完成后，您可以通过命令行直接使用 PaddleOCR。以下是一个简单的命令行示例，用于执行文本检测和识别：

paddleocr ocr -i ./general_ocr_002.png --use_doc_orientation_classify False --use_doc_unwarping False --use_textline_orientation False

五、Python 脚本使用

您也可以在 Python 脚本中导入 PaddleOCR 并使用其 API 进行更复杂的应用开发。

from paddleocr import PaddleOCR# 创建 PaddleOCR 对象
ocr = PaddleOCR(use_doc_orientation_classify=False, use_doc_unwarping=False, use_textline_orientation=False
)
# ocr = PaddleOCR(use_doc_orientation_classify=True, use_doc_unwarping=True) # 文本图像预处理+文本检测+方向分类+文本识别
# ocr = PaddleOCR(use_doc_orientation_classify=False, use_doc_unwarping=False) # 文本检测+文本行方向分类+文本识别
# ocr = PaddleOCR(
#     text_detection_model_name="PP-OCRv5_mobile_det",
#     text_recognition_model_name="PP-OCRv5_mobile_rec",
#     use_doc_orientation_classify=False,
#     use_doc_unwarping=False,
#     use_textline_orientation=False) # 更换 PP-OCRv5_mobile 模型
# 执行预测
result = ocr.predict("./general_ocr_002.png")# 输出结果
for res in result:res.print()res.save_to_img("output")res.save_to_json("output")

六、输出示例

以下是 PaddleOCR 输出结果的示例，包含检测到的文本、位置信息和置信度等：

{'res': {'input_path': '/root/.paddlex/predict_input/general_ocr_002.png','page_index': None,'model_settings': {'use_doc_preprocessor': True,'use_textline_orientation': False},'doc_preprocessor_res': {'input_path': None,'page_index': None,'model_settings': {'use_doc_orientation_classify': False,'use_doc_unwarping': False},'angle': -1},'dt_polys': array([[[  3,  10], ...]], dtype=int16),'text_det_params': {'limit_side_len': 736,'limit_type': 'min','thresh': 0.3,'max_side_limit': 4000,'box_thresh': 0.6,'unclip_ratio': 1.5},'text_type': 'general','textline_orientation_angles': array([-1, ..., -1]),'text_rec_score_thresh': 0.0,'rec_texts': ['www.997700', 'Cm', '登机牌', 'BOARDING', 'PASS', ...],'rec_scores': array([0.67582953, ..., 0.97418666]),'rec_polys': array([[[  3,  10], ...]], dtype=int16),'rec_boxes': array([[  3, ...,  30], ..., [ 99, ..., 479]], dtype=int16)}
}