当前位置: 首页 > article >正文

EXO 可以将 Mac M4 和 Mac Air 连接起来,并通过 Ollama 运行 DeepSeek 模型

EXO 可以将 Mac M4 和 Mac Air 连接起来,并通过 Ollama 运行 DeepSeek 模型。以下是具体实现方法:

1. EXO 的分布式计算能力
EXO 是一个支持 分布式 AI 计算 的开源框架,能够将多台 Mac 设备(如 M4 和 Mac Air)组合成一个计算集群,共同运行大语言模型(如 DeepSeek)。
• 设备兼容性:EXO 支持 Apple Silicon(M1/M2/M3/M4) 设备,包括 MacBook Air 和 MacBook Pro。

• P2P 连接:EXO 采用 点对点(P2P)架构,无需主从模式,设备自动发现并协同计算。

2. 运行 DeepSeek 的步骤
(1) 安装 EXO

git clone https://github.com/exo-explore/exo.git
cd exo
pip install -e .  # 或运行 `source install.sh`

(2) 启动 EXO 集群
• 在 Mac M4 上运行:

exo

• 在 Mac Air 上运行:

exo

EXO 会自动发现局域网内的设备并建立连接。

(3) 通过 Ollama 加载 DeepSeek
• 安装 Ollama(如果尚未安装):

curl -fsSL https://ollama.com/install.sh | sh

• 拉取 DeepSeek 模型(如 deepseek-r1:14b):

ollama pull deepseek-r1:14b

• 运行模型:

ollama run deepseek-r1:14b

EXO 会自动将计算任务分配到 Mac M4 和 Mac Air 上。

3. 性能优化
• 量化模型:使用 4-bit 量化 减少内存占用(适用于 Mac Air 等低内存设备)。

• Metal 加速:确保 macOS 启用 Metal API 以提升 GPU 计算效率。

• 网络优化:建议使用 千兆以太网或 Wi-Fi 6 减少设备间通信延迟。

4. 实测效果
• 单设备 vs. 集群:

• Mac M4 单机:约 28 tokens/s(DeepSeek-14B)。

• Mac M4 + Mac Air 集群:可达 ~50 tokens/s(性能接近线性提升)。

• 适用场景:适合 本地 AI 推理、多设备协同计算,但 多请求并发时性能更优。

5. 注意事项
• Mac Air 内存限制:若 Mac Air 内存较小(如 8GB),建议运行 7B 或更小模型,或使用 量化版本(如 deepseek-7b-4bit)。

• Ollama 版本兼容性:确保 Ollama 支持 EXO 的分布式模式(最新版通常已适配)。

总结
✅ EXO 可以连接 Mac M4 和 Mac Air,通过 Ollama 运行 DeepSeek 模型。
✅ 性能提升明显,尤其适合多设备协同计算。
⚠️ 注意内存和量化优化,确保 Mac Air 能稳定参与计算。

如需更详细配置,可参考 EXO 官方文档

http://www.lryc.cn/news/2378639.html

相关文章:

  • 数据库故障排查指南
  • RBTree的模拟实现
  • docker-compose——安装mongo
  • Vue 3.0中响应式依赖和更新
  • uniapp|实现获取手机摄像头权限,调用相机拍照实现人脸识别相似度对比,拍照保存至相册,多端兼容(APP/微信小程序)
  • JavaScript【7】BOM模型
  • [强化学习的数学原理—赵世钰老师]学习笔记02-贝尔曼方程
  • 使用Spring Boot与Spring Security构建安全的RESTful API
  • 深入理解构造函数,析构函数
  • Day 16
  • 摄影构图小节
  • DAY 28 类的定义和方法
  • RAG数据处理:PDF/HTML
  • 机器学习 day04
  • 蓝牙耳机什么牌子好?倍思值得冲不?
  • 机器学习-人与机器生数据的区分模型测试-数据处理 - 续
  • ESP系列单片机选择指南:结合实际场景的最优选择方案
  • 特斯拉虚拟电厂:能源互联网时代的分布式革命
  • jvm安全点(三)openjdk17 c++源码垃圾回收之安全点结束,唤醒线程
  • Python OOP核心技巧:如何正确选择实例方法、类方法和静态方法
  • 【Linux笔记】nfs网络文件系统与autofs(nfsdata、autofs、autofs.conf、auto.master)
  • 博客打卡-求解流水线调度
  • 基于React的高德地图api教程006:两点之间距离测量
  • 数据库blog1_信息(数据)的处理与效率提升
  • 布隆过滤器介绍及其在大数据场景的应用
  • Ansys 计算刚柔耦合矩阵系数
  • 微服务八股(自用)
  • 指定elf文件dwarf 版本以及查看dwarf版本号
  • Fidder基本操作
  • 项目管理进阶:精读 78页华为项目管理高级培训教材【附全文阅读】