当前位置: 首页 > news >正文

MinerU容器构建教程

一、介绍

MinerU作为一款智能数据提取工具,其核心功能之一是处理PDF文档和网页内容,将其中的文本、图像、表格、公式等信息提取出来,并转换为易于阅读和编辑的格式(如Markdown)。在这个过程中,MinerU需要利用图像识别、文本识别(OCR)、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。

二、构建流程

系统:Ubuntu系统,

显卡:3090,

显存:24G,cuda11.8

特别提示:使用显卡3060也可以(没尝试,感觉可以)

1.查看系统是否有Miniconda3的虚拟环境

conda -V
如果输入命令没有显示Conda版本号,则需要安装。

屏幕截图

2.更新系统命令

输入下列命令将系统更新及系统下载

apt-get update && apt-get install ffmpeg libsm6 libxext6  -y

微信截图_20240820152809.png

3.创建虚拟环境

  • 创建名称为MinerU的虚拟环境
conda create -n MinerU python=3.8

微信截图_20240903144226.png

  • 激活“MinerU"虚拟环境
conda activate MinerU

微信截图_20240903144314.png

4.下载模型

输入下列命令对MinerU模型进行下载(11G左右)

git clone https://gitclone.com/github.com/opendatalab/MinerU.git

微信截图_20240903144718.png

进入模型文件

cd MinerU-master

微信截图_20240903145342.png

5.下载依赖包

输入下列命令:

pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com

微信截图_20240903145522.png

下载时间会很长,耐心等待,直到出现“Successfully”开头的下载结果

微信截图_20240903151456.png

6.下载模型权重文件

输入下列命令进行下载:

git lfs install
git clone https://hf-mirror.com/opendatalab/PDF-Extract-Kit

微信截图_20240903164514.png

更改权重文件路径(后面运行找不到权重,你也可以更改运行代码的获取权重文件路径):

cp -r /MinerU-madter/PDF-Extract-Kit/models  /tmp/

微信截图_20240903171353.png

7.项目运行

"try.pdf"是本上传用于测试的文档,你可以根据自己所需上传自己的PDF文档。

输入下列命令:

magic-pdf –path “try.pdf”

微信截图_20240903171335.png

解析结束:

微信截图_20240903171637.png

查看结果文件:

微信截图_20240903171646.png

http://www.lryc.cn/news/481333.html

相关文章:

  • BFS 解决拓扑排序
  • MySQL 程序设计课程复习大纲
  • C++ : STL容器(适配器)之stack、queue剖析
  • nuxt3安装pinia报错500[vite-node] [ERR_LOAD_URL]问题解决
  • 青少年编程能力等级测评CPA试卷(2)Python编程(一级)
  • wordpress判断page页与非page页
  • JavaScript 库-qs的使用
  • Leetcode 两数之和 Ⅱ - 输入有序数组
  • 多处理器一致协议(MSI)协议详细介绍
  • SSH实验5密钥登录Linuxroot用户(免密登录)
  • 2024 网鼎杯 - 青龙组 Web WP
  • ORACLE 闪回技术简介
  • 【笔记】LLC电路工作频点选择 2-2 开关管与滤波压力
  • 【CUDA】认识CUDA
  • Linux(CentOS)yum update -y 事故
  • AI绘画赚钱秘籍!掌握ai绘画赚钱技巧,开启副业新篇章,ai绘画赚钱实战指南!
  • HCIP-HarmonyOS Application Developer V1.0 笔记(四)
  • 【前端】Svelte:组件封装与使用
  • STM32标准库-待机模式
  • 【论文笔记】The Power of Scale for Parameter-Efficient Prompt Tuning
  • 几个docker可用的镜像源
  • Spring学习笔记_27——@EnableLoadTimeWeaving
  • 【数据分析】如何构建指标体系?
  • 大数据程序猿不可不看的资料大全
  • 【架构设计常见技术】
  • LLMs之MemFree:MemFree的简介、安装和使用方法、案例应用之详细攻略
  • Hive简介 | 体系结构
  • [C++] GDB的调试和自动化检测
  • 车机版 Android Audio 框架笔记
  • 【NLP自然语言处理】深入解析Encoder与Decoder模块:结构、作用与深度学习应用