当前位置: 首页 > news >正文

本地安装部署Unstructured-api

本地安装Unstructured-api

  • 1. 源码部署
    • 创建环境并激活
    • 安装依赖
    • 启动项目
    • 调试项目
  • 2. Docker部署
    • 1. 下载镜像
    • 2. 启动容器
  • 3. 结束
  • 4.遇到问题(在更新......)

1. 源码部署

  1. 需要提前安装->uv

  2. 前往[Github地址](GitHub - Unstructured-IO/unstructured-api) 下载源码或者直接执行git clone命令

    $ git clone https://github.com/Unstructured-IO/unstructured-api.git
    

    创建环境并激活

$ uv venv
$ source .venv/bin/activate

安装依赖

进入源码地址目录unstructured-api下执行以下命令

$ uv pip install  -r requirements/base.in

启动项目

$ uvicorn prepline_general.api.app:app --host 0.0.0.0 --port 8888 --reload 

调试项目

本文示例是在VS Code中调试,步骤如下:

  1. 打开VS Code,点击左侧面板中的菜单的Run And Debugger,点击创建launch.json文件

  2. 在弹开的Select debugger窗口中选择Python Debugger,再在弹开的Debug Configuration窗口中选择FastAPI

  3. 在自动创建的launch.json文件中贴上以下内容

    {// Use IntelliSense to learn about possible attributes.// Hover to view descriptions of existing attributes.// For more information, visit: https://go.microsoft.com/fwlink/?linkid=830387"version": "0.2.0","configurations": [{"name": "FastAPI: Python Debugger","consoleName": "FastAPI","type": "debugpy","request": "launch","python": "${workspaceFolder}/.venv/bin/python","cwd": "${workspaceFolder}","module": "uvicorn","justMyCode": true,"args": ["prepline_general.api.app:app","--host","0.0.0.0","--port","8888","--reload"],"jinja": true}]
    }
    
  4. 保存退出后即可在左侧的Run And Debug面板中点击绿色三角按钮启动。

2. Docker部署

1. 下载镜像

官方提供的docker镜像下载地址已经失效,目前找到了第三方基于源码的镜像编译,测试过能启动,能访问,但是其它具体的接口没有细测过:

$ docker pull robwilkes/unstructured-api:0.0.82 

2. 启动容器

$ docker run -p 8888:8000 -d --rm --name unstructured-api robwilkes/unstructured-api:0.0.82

3. 结束

相关接口请查看官方介绍 -> https://github.com/Unstructured-IO/unstructured-api

4.遇到问题(在更新…)

Q1:在Apifox请求接口时出现了"There was an error parsing the body",特别是上传附件时便会报该错误。
A1:pydantic的版本有问题,可参考本示例中fastapi版本和pydantic版本:
fastapi:0.113.0
pydantic:2.11.7

Q2:启动过程若是报错:punkt_tab找不到,提示你执行nltk下载依旧失败
A2:访问nltk_data官网拷贝下其packages目录代码放在跟preline_general统计目录下:

在这里插入图片描述

http://www.lryc.cn/news/593557.html

相关文章:

  • Flutter基础(前端教程①③-单例)
  • 优先算法——专题十:哈希表
  • kafka--基础知识点--6--AR、ISR、OSR
  • Django母婴商城项目实践(九)- 商品列表页模块
  • [论文阅读] 软件工程 | 用模糊逻辑“解锁”项目成功:告别非黑即白的评估时代
  • 多进程服务器
  • 千线万网,电路之行——LVS检查的内核逻辑
  • k8s 基本架构
  • K8s与Helm实战:从入门到精通
  • 第五章 用Java实现JVM之运行时数据区
  • Linux内核设计与实现 - 第5章 系统调用
  • 堆堆堆,咕咕咕
  • Java行为型模式---中介者模式
  • 【办公类-107-02】20250719视频MP4转gif(削减MB)
  • Triton的核心概念与简单入门
  • 突破研究边界!探索OpenAI o3与o4-mini模型的无限可能
  • Attu-Milvus向量数据库可视化工具
  • 《Linux系统配置实战:NTP时间同步与SSH免密登录全流程指南》​​
  • Linux练习二
  • 低代码平台ToolJet实战总结
  • 网络大提速,RDMA,IB,iWrap
  • windows docker-03-如何一步步学习 docker
  • 游戏开发日志
  • SurfaceView、TextureView、SurfaceTexture 和 GLSurfaceView
  • eNSP综合实验(DNCP、NAT、TELET、HTTP、DNS)
  • 西门子 S7-1500 PLC 电源选型指南:系统电源与负载电源的核心区别
  • 【Linux服务器】-zabbix通过proxy进行分级监控
  • 【初识数据结构】CS61B中的基本图算法:DFS, BFS, Dijkstra, A* 算法及其来历用法
  • JavaSE-接口
  • 枚举类高级用法