当前位置: 首页 > news >正文

mac m1安装大模型工具vllm

1 更新系统环境

参考vllm官网文档,vllm对apple m1平台mac os, xcoder, clang有如下要求

OS: macOS Sonoma or later

SDK: XCode 15.4 or later with Command Line Tools

Compiler: Apple Clang >= 15.0.0

在App Store更新macOS和XCoder,依据XCoder版本号安装command line tools。

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

 2 安装anconda并初始化虚拟环境

下载并安装apple m1版本anconda

比如 Anaconda3-2025.06-0-MacOSX-arm64.pkg

https://www.anaconda.com/download-success

初始化conda虚拟环境

conda create -n vllm python=3.12

conda activate vllm

3 安装vllm

1)下载vllm

git clone https://github.com/vllm-project/vllm.git

大部分情况git clone会失败,所以直接下载vllm的release版本,这里下载0.92,链接如下。

https://github.com/vllm-project/vllm/releases/download/v0.9.2/vllm-0.9.2.tar.gz

https://github.com/vllm-project/vllm/releases

2)安装vllm

先安装依赖

cd vllm

pip install -r requirements/cpu.txt

conda install cmake

conda install ninja

再安装vllm

pip install -e .

需注意的是以上操作要在mac自带终端下完成,在iterm下会遇到编译问题。

4 验证vllm

vLLM 将 Hugging Face 模型下载到本地,默认 ~/cache/huggingface/hub 文件夹中。

以下是测试代码。

import osos.environ["HF_ENDPOINT"] = "https://hf-mirror.com"from vllm.entrypoints.llm import LLM
from vllm.sampling_params import SamplingParamsmodel_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"llm = LLM(model=model_name, max_model_len=128)sampling_params = SamplingParams(temperature = 0.9,max_tokens = 100)
prompt = "中国首都在那?"
output = llm.generate(prompt, sampling_params)print(output)
print(output[0].outputs[0].text)

另外,vLLM 还可以作为服务运行。

目前存在的问题是运行慢,后续看看有效的量化方法。

reference

---

vllm

https://github.com/vllm-project/vllm.git

vllm CPU install doc

https://docs.vllm.ai/en/latest/getting_started/installation/cpu.html

mac command line tools

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

小白入门:使用vLLM在本机MAC上部署大模型

https://www.53ai.com/news/OpenSourceLLM/2025040116542.html

hf-mirror

https://hf-mirror.com/

http://www.lryc.cn/news/583121.html

相关文章:

  • Vue的watch和React的useEffect
  • “AI 曼哈顿计划”:科技竞赛还是人类挑战?
  • 电商销量第一,贝锐向日葵智能远控硬件背后的软硬结合战略
  • Mac mini 高性价比扩容 + Crossover 游戏实测 全流程手册
  • Python-FAQ-单例模式
  • 深入理解图像二值化:从静态图像到视频流实时处理
  • 一天两道力扣(3)
  • 计蒜客T3473丑数、Leetcode2401最长优雅子数组、Leetcode167两数之和、Leetcode581最短无序连续子数组
  • 开源链动2+1模式与AI智能名片融合下的S2B2C商城小程序源码:重构大零售时代新生态
  • 【工具】Pycharm隐藏文件类型或目录
  • Hive MetaStore的实现和优化
  • AI+智慧园区 | 事件处置自动化——大模型重构园区治理逻辑
  • 向量空间 线性代数
  • 两张图片对比clip功能
  • 在 PyCharm 中安装并配置 Node.js 的指南
  • 整合Spring、Spring MVC与MyBatis:构建高效Java Web应用
  • Linux的 `test`命令(或等价中括号写法 `[空格expression空格]`)的用法详解. 笔记250709
  • 自制明信片DIY:让心意更有温度
  • python Gui界面小白入门学习
  • OpenCV图像增强秘籍:高通滤波与特效艺术
  • 学习open62541 --- [79] 在docker中运行open62541工程
  • SpringCloud系列 - xxl-job 分布式任务调度 (七)
  • Docker高级管理
  • Wireshark抓包实验之TCP连接
  • 使用 Docker Compose 简化 INFINI Console 与 Easysearch 环境搭建
  • 数据管理新范式:基于Docker的私有云存储系统构建指南
  • 7.9 note| dfs
  • 【Linux】Rocky Linux 安装 Docker 与 Docker-Compose
  • 【vLLM 学习】Eagle
  • 多代理混战?用 PAC(Proxy Auto-Config) 优雅切换代理场景