当前位置：首页 > news >正文

Windows 安装 Xinference 速记

news 2025/8/10 13:33:32

Windows 安装 Xinference 速记

1. 环境准备

系统：Windows（含 NVIDIA GPU，CUDA ≥ 12.9）
Python：3.10（推荐 Conda 环境）

conda create -n xinference python=3.10 -y
conda activate xinference

2. 安装依赖

在命令行窗口查看cuda版本：bash nvidia-smi

依赖	安装命令
PyTorch 2.0.1 + CUDA 12.9	`conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=12.9 -c pytorch -c nvidia`
llama-cpp-python	`pip install https://github.com/abetlen/llama-cpp-python/releases/download/v0.2.55/llama_cpp_python-0.2.55-cp310-cp310-win_amd64.whl`
chatglm-cpp	`pip install https://github.com/li-plus/chatglm.cpp/releases/download/v0.3.1/chatglm_cpp-0.3.1-cp310-cp310-win_amd64.whl`
Xinference	`pip install "xinference[all]"`

3. 环境变量配置

设置模型缓存路径（按需修改）：

# Windows 系统环境变量
XINFERENCE_HOME=D:\XinferenceCache

4. 启动服务

命令行启动

xinference-local -H <本机 IP>

浏览器访问 http://<IP>:9997
在 Running Models 页面选择并加载模型。

5. 常见问题速查

问题	解决方案
PyExtensionType 报错	`pyarrow=21.0.0版本太新了，得安装旧版本如18.0.0 （ pip install --user --upgrade pyarrow==18.0.0 ）`
中文乱码	启动前执行 `chcp 65001`
无法拉取镜像	`docker login xprobe/xinference:latest` 或换源

6. 验证

浏览器打开 http://localhost:9997
加载模型 → 查看 Cluster Information → 完成！

✅ 至此，Xinference 已在 Windows 上成功部署并可用。

http://www.lryc.cn/news/615489.html

相关文章：

CPU缓存（CPU Cache）和TLB（Translation Lookaside Buffer）缓存现代计算机体系结构中用于提高性能的关键技术

【线性代数】线性方程组与矩阵——（2）矩阵与线性方程组的解

计算机网络：深入了解CIDR地址块如何利用VLSM进行子网划分的过程

前端视角下关于 WebSocket 的简单理解

如何在 Ubuntu 24.04 LTS Linux 上安装 Azure Data Studio

【排序算法】④堆排序

基于STM32H5的非循环GPDMA链表使用

LangChain-Unstructured 基础使用：PDF 与 Markdown 处理解析

基于IPD体系的研发项目范围管理

【网络与爬虫 52】Scrapyd-k8s集群化爬虫部署：Kubernetes原生分布式爬虫管理平台实战指南

一个app项目周期是多久?

Java异常：认识异常、异常的作用、自定义异常

世界时（Universal Time, UT）的定义与详解

小学数学训练闭环：出题、作答、批改一体化方案实践

[Oracle] MAX()和MIN()函数

【Python 高频 API 速学 ④】

LintCode第547题-两数组的交集

腾讯COS云存储入门

浅尝AI辅助C转Verilog方法

新手小白使用jQuery在实际开发中常用到的经验

第二十天：余数相同问题

《Resolving tissue complexity by multimodal spatial omics modeling with MISO》

【面试场景题】微博热点新闻系统设计方案

day18 - CSS函数

nginx高性能web服务器

基于Prometheus、Grafana、Loki与Tempo的统一监控平台故障排查与解决方案

java组件安全vulhub靶场

[激光原理与应用-206]：光学器件 - SESAM - 基本结构与工作原理

通用AGI到来，记忆仍需要一点旧颜色

【Python 高频 API 速学 ⑦ · 完结篇】