当前位置: 首页 > news >正文

MinerU2将PDF转成md文件,并分拣图片

首先自行安装python3,必须大于3.10以上的版本

博主是已经有了python3,这里就不演示了

1.先跟新下依赖

pip install --upgrade pip -i https://mirrors.aliyun.com/pypi/simple
pip install uv -i https://mirrors.aliyun.com/pypi/simple 

 创建虚拟环境

uv venv

 激活虚拟环境

.venv\Scripts\activate

下载MinerU2核心版

# Windows、Linux和macOS系统无显卡
uv pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple# Linux和macOS系统并且有显卡,显存大于8G  安装下面这个
uv pip install -U "mineru[all]" -i https://mirrors.aliyun.com/pypi/simple

 Windows 必须安装 PyTorch 

有显卡的

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

无显卡

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

 操作后验证

mineru --version

 下载模型

mineru-models-download
  • 有梯子,如果是默认的直接回车
  • 没有梯子,输入 modelscope 并回车
  • 提示 Please select the model type to download: (pipeline, vlm, all) [all] 时,直接回车选择 all(下载所有模型)
  • 模型默认下载到 C:\Users\用户名\.mineru\models 目录,可通过 mineru.json 配置路径。

下载报错超时,有时候不知道什么时候设置了使用国内镜像,临时关闭国内镜像(用官方源)

# Windows(cmd/PowerShell)
set HF_ENDPOINT=https://huggingface.co# 然后重新运行模型下载命令
mineru-models-download

下载报错超时,没梯子的用 ModelScope 镜像

# 临时切换(单次生效)
set HF_ENDPOINT=https://modelscope.cn/api/v1/models# 永久配置(系统环境变量中添加 HF_ENDPOINT = https://modelscope.cn/api/v1/models)

 直接的用法是用 mineru 解析 PDF / 图片,提取文本、公式、表格等内容

mineru -p "你的文件路径" -o "输出目录" -b 后端名称 -d 设备
  • 参数说明
    • -p:指定要处理的文件路径(支持 PDF、图片等,比如 test.pdf 或 image.png )。
    • -o:指定输出目录,解析后的文本、结构化数据会存到这里。
    • -b:选择解析后端,结合你之前提到的,常用 pipeline(兼容性好,无显卡也能用 )、vlm-transformers(依赖 GPU )、vlm-sglang(需特定环境,比如 WSL2 + GPU )。
    • -d:指定推理设备,cpu 或 cuda(有 NVIDIA 显卡且装了对应驱动、PyTorch 时用 cuda 加速 )。

示例(无显卡,用 pipeline 后端)

mineru -p "C:\Users\Administrator\test.pdf" -o "C:\Users\Administrator\output" -b pipeline -d cpu

启动可视化界面(更直观操作)

mineru-gradio --server-name 127.0.0.1 --server-port 7860

结合具体需求扩展

mineru -p "test.pdf" -o "output" -b pipeline -d cpu -f true -t true

这里 -f true 强制公式识别,-t true 强制表格识别,确保这两部分内容被重点解析。

或者使用视图窗口 前提安装Gradio

pip install gradio

启动视图

mineru-gradio --server-name 127.0.0.1 --server-port 7860

访问127.0.0.1:7860

python3代码中使用

import subprocess# 调用 mineru 命令行解析文档
result = subprocess.run(["mineru", "-p", "test.pdf", "-o", "output", "-b", "pipeline", "-d", "cpu"],capture_output=True,text=True
)
print(result.stdout)  # 输出解析过程日志、结果信息

http://www.lryc.cn/news/584547.html

相关文章:

  • uniapp滚动组件, HuimayunScroll:高性能移动端滚动组件的设计与实现
  • 【Fargo】发送一个rtp包的过程1:怎么统一加twcc序号
  • 创始人IP如何进阶?三次关键突破实现高效转化
  • 使用SpringAOP自定义权限控制注解
  • 音频 SDP 文件格式
  • ElementUI:高效优雅的Vue.js组件库
  • Linux epoll简介与C++TCP服务器代码示例
  • Rust中Option和Result详解
  • Rust Web 全栈开发(四):构建 REST API
  • 单片机基础(STM32-DAY2(GPIO))
  • Apache Shiro 框架详解
  • 缺乏日常项目进度例会机制,如何系统推进
  • python的第三方库(五分钟小白从入门到精通)
  • 什么是 领域偏好学习(DPO)与多目标强化学习(PPO)
  • 抽象类基础知识
  • 5. isaac sim4.2 教程-Core API-操作机械臂
  • 大模型之Langchain篇——基础操作
  • 编写DockerFile文件
  • Dart 语言知识点总结
  • C++编程学习阶段性总结
  • python-字符串
  • 钉钉拿飞书当靶
  • 服务器内核级故障排查
  • 深入理解区块链 | 去中心化架构与密码学保障
  • Redisson 的分布式锁
  • (一)OpenCV——噪声去除(降噪)
  • 职坐标:嵌入式AI边缘计算实战
  • [5种方法] 如何将iPhone短信保存到电脑
  • 【网络】Linux 内核优化实战 - net.ipv4.tcp_keepalive_intv
  • Cloudflare 发布容器服务公测版:边缘计算新时代来临?