当前位置: 首页 > news >正文

Windows 安装 Xinference

Windows 安装 Xinference

  • 0. 引言
  • 1. 创建虚拟环境
  • 2. 安装 pytorch
  • 3. 安装 llama_cpp_python
  • 4. 安装 chatglm-cpp
  • 5. 安装 Xinference
  • 6. 设置 model 路径
  • 7. 启动 Xinference
  • 8. 查看 Cluster Information

0. 引言

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。

为什么选择 Xinference?

在这里插入图片描述

启动后的画面,

在这里插入图片描述

1. 创建虚拟环境

conda create -n xinference python=3.10 -y
conda activate xinference 

2. 安装 pytorch

conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.8 -c pytorch -c nvidia

3. 安装 llama_cpp_python

pip install https://github.com/abetlen/llama-cpp-python/releases/download/v0.2.55/llama_cpp_python-0.2.55-cp310-cp310-win_amd64.whl

refer: https://github.com/abetlen/llama-cpp-python

4. 安装 chatglm-cpp

pip install https://github.com/li-plus/chatglm.cpp/releases/download/v0.3.1/chatglm_cpp-0.3.1-cp310-cp310-win_amd64.whl

refer: https://github.com/li-plus/chatglm.cpp

5. 安装 Xinference

pip install "xinference[all]"

refer: https://github.com/xorbitsai/inference

6. 设置 model 路径

在我的电脑上设置环境变量,路径请根据各自环境修改。

XINFERENCE_HOME=F:\XinferenceCache

7. 启动 Xinference

xinference-local -H <your_ip>

在这里插入图片描述
选择一个 Model 运行,

在这里插入图片描述
运行成功后,在 “Running Models” 页面可以查看,

在这里插入图片描述

8. 查看 Cluster Information

点击 Cluster Information,

在这里插入图片描述
完结!

http://www.lryc.cn/news/313754.html

相关文章:

  • 静态时序分析:SDC约束命令set_case_analysis详解
  • C++ · 代码笔记4 ·继承与派生
  • 解决uni-app中使用webview键盘弹起遮挡input输入框问题
  • Java注解介绍
  • 万字详解,Java实现低配版线程池
  • 挂耳式蓝牙耳机哪家的好用?购买耳机前必须了解的几大要点
  • CSS文本属性
  • MySQL篇—执行计划之覆盖索引Using index和条件过滤Using where介绍(第三篇,总共三篇)
  • 最短路径(2.19)
  • vue 总结
  • 深入理解TCP/IP协议:互联网通信的核心
  • Python数据处理实战(4)-上万行log数据提取并作图进阶版
  • JavaWeb Tomcat启动、部署、配置、集成IDEA
  • 关于Vue3的一些操作
  • 外贸常用的出口认证 | 全球外贸数据服务平台 | 箱讯科技
  • C++ 标准库类型string
  • Material UI 5 学习02-其它按钮组件
  • Express学习(三)
  • influxdb2.0插入数据字段类型出现冲突问题解决
  • [C++]类和对象,explicit,static,友元,构造函数——喵喵要吃C嘎嘎4
  • 物联网的商业模式洞察
  • 智能指针基础知识【C++】【RAII思想 || unique_ptr || shared_ptrweak_ptr || 循环引用问题】
  • leetcode:反转链表II 和k个一组反转链表的C++实现
  • ERD Online 快速启动指南:代码下载到首次运行的全流程攻略 ️
  • c++ 11 新特性 不同数据类型之间转换函数之const_cast
  • C++从零开始的打怪升级之路(day45)
  • 小鹅通前端实习一面
  • ArrayList常用API
  • Chrome安装Axure插件
  • 【AI+应用】模仿爆款视频二次创作短视频操作步骤