当前位置：首页 > news >正文

M1芯片macOS安装Xinference部署大模型

news 2025/9/12 15:17:34

如果你看的是官方手册：安装 — Xinference

千万不要直接运行：

pip install "xinference[all]"

会遇到几个问题：
1）Python版本如果太新可能安装失败

2）全量安装会失败

3）未科学上网可能会timeout

我目前的做法如下：

1）安装mini-conda

2）创建虚拟环境，Python指定3.11版本，并激活运行

conda create -n xinference python=3.11
conda activate xinference

3）安装官方文档，运行不同的引擎，我推荐使用下面的：

Transformers 引擎

PyTorch(transformers) 引擎支持几乎有所的最新模型，这是 Pytorch 模型默认使用的引擎：

pip install "xinference[transformers]"

如果是M系列芯片的mac，还可以选择：

MLX 引擎

MLX-lm 用来在苹果 silicon 芯片上提供高效的 LLM 推理。

初始步骤：

pip install "xinference[mlx]"

其他引擎大家自行选择。

完成引擎安装后，就可以运行了：

xinference-local --host 0.0.0.0 --port 9997

后续访问 127.0.0.1:9997 即可进行配置；

如果是dify使用，先安装Xorbits Inference插件。

如果是docker部署，则大模型的服务器URL如下：

http://host.docker.internal:9997

查看全文

http://www.lryc.cn/news/572493.html

Datawhale 网络爬虫技术入门第2次笔记

QT6与VS下实现没有CMD窗口的C++控制台程序

日本生活：日语语言学校-日语作文-沟通无国界（３）-题目：わたしの友達

编程马拉松的定义、运作与发展

C语言标准I/O库详解：文件操作与缓冲区机制

Qt蓝图式技能编辑器状态机模块设计与实现

html实现登录与注册功能案例（不写死且只使用js）

深入解析select模型：FD_SET机制与1024限制的终极指南

Linux系统远程操作和程序编译

23.ssr和csr的对比？如何依赖node.js实现

[11-5]硬件SPI读写W25Q64 江协科技学习笔记（20个知识点）

嵌入式编译工具链熟悉与游戏移植

基于C#的Baumer相机二次开发教程

OpenSSL引擎 + PKCS11 + SoftHSM2认证

WHAT - React Native 开发 App 从 0 到上线全流程周期

【嵌入式】鲁班猫玩法大全

第1章：伯努利模型的极大似然估计与贝叶斯估计

软件工程（期末复习班）

23种设计模式--简单工厂模式理解版

Arduino Nano 33 BLE Sense Rev 2开发板使用指南之【外设开发】

零基础指南：利用Cpolar内网穿透实现Synology Drive多端笔记同步

Linux基本指令篇 —— mkdir指令

MFC中使用CRichEditCtrl控件让文本框中的内容部分加粗

分布变化的模仿学习算法

257. 二叉树的所有路径（js）

【数据治理】要点整理-信息技术服务治理第5部分-数据治理规范-GBT+34960.5-2018

C#设计模式之AbstractFactory_抽象工厂_对象创建新模式-练习制作PANL（一）

C# winform教程(二)----GroupBox

vscode设置代码字体

Web 应用防火墙（WAF）工作原理、防护策略与部署模式深度剖析

Transformers 引擎

MLX 引擎

相关文章：