当前位置: 首页 > news >正文

Windows 安装 Xinference 速记

Windows 安装 Xinference 速记


1. 环境准备

  • 系统:Windows(含 NVIDIA GPU,CUDA ≥ 12.9)
  • Python:3.10(推荐 Conda 环境)
conda create -n xinference python=3.10 -y
conda activate xinference

2. 安装依赖

  • 在命令行窗口查看cuda版本bash nvidia-smi
依赖安装命令
PyTorch 2.0.1 + CUDA 12.9conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=12.9 -c pytorch -c nvidia
llama-cpp-pythonpip install https://github.com/abetlen/llama-cpp-python/releases/download/v0.2.55/llama_cpp_python-0.2.55-cp310-cp310-win_amd64.whl
chatglm-cpppip install https://github.com/li-plus/chatglm.cpp/releases/download/v0.3.1/chatglm_cpp-0.3.1-cp310-cp310-win_amd64.whl
Xinferencepip install "xinference[all]"

3. 环境变量配置

设置模型缓存路径(按需修改):

# Windows 系统环境变量
XINFERENCE_HOME=D:\XinferenceCache

4. 启动服务

命令行启动

xinference-local -H <本机 IP>
  • 浏览器访问 http://<IP>:9997
  • Running Models 页面选择并加载模型。

5. 常见问题速查

问题解决方案
PyExtensionType 报错pyarrow=21.0.0版本太新了,得安装旧版本如18.0.0 ( pip install --user --upgrade pyarrow==18.0.0 )
中文乱码启动前执行 chcp 65001
无法拉取镜像docker login xprobe/xinference:latest 或换源

6. 验证

  • 浏览器打开 http://localhost:9997
  • 加载模型 → 查看 Cluster Information → 完成!

✅ 至此,Xinference 已在 Windows 上成功部署并可用。

http://www.lryc.cn/news/615489.html

相关文章:

  • CPU缓存(CPU Cache)和TLB(Translation Lookaside Buffer)缓存现代计算机体系结构中用于提高性能的关键技术
  • 【线性代数】线性方程组与矩阵——(2)矩阵与线性方程组的解
  • 计算机网络:深入了解CIDR地址块如何利用VLSM进行子网划分的过程
  • 前端视角下关于 WebSocket 的简单理解
  • 如何在 Ubuntu 24.04 LTS Linux 上安装 Azure Data Studio
  • 【排序算法】④堆排序
  • 基于STM32H5的非循环GPDMA链表使用
  • LangChain-Unstructured 基础使用:PDF 与 Markdown 处理解析
  • 基于IPD体系的研发项目范围管理
  • 【网络与爬虫 52】Scrapyd-k8s集群化爬虫部署:Kubernetes原生分布式爬虫管理平台实战指南
  • 一个app项目周期是多久?
  • Java异常:认识异常、异常的作用、自定义异常
  • 世界时(Universal Time, UT)的定义与详解
  • 小学数学训练闭环:出题、作答、批改一体化方案实践
  • [Oracle] MAX()和MIN()函数
  • 【Python 高频 API 速学 ④】
  • LintCode第547题-两数组的交集
  • 腾讯COS云存储入门
  • 浅尝AI辅助C转Verilog方法
  • 新手小白使用jQuery在实际开发中常用到的经验
  • 第二十天:余数相同问题
  • 《Resolving tissue complexity by multimodal spatial omics modeling with MISO》
  • 【面试场景题】微博热点新闻系统设计方案
  • day18 - CSS函数
  • nginx高性能web服务器
  • 基于Prometheus、Grafana、Loki与Tempo的统一监控平台故障排查与解决方案
  • java组件安全vulhub靶场
  • [激光原理与应用-206]:光学器件 - SESAM - 基本结构与工作原理
  • 通用AGI到来,记忆仍需要一点旧颜色
  • 【Python 高频 API 速学 ⑦ · 完结篇】