当前位置: 首页 > article >正文

多卡跑ollama run deepseek-r1

# 设置环境变量并启动模型
export CUDA_VISIBLE_DEVICES=0,1,2,3
export OLLAMA_SCHED_SPREAD=1  # 启用多卡负载均衡
ollama run deepseek-r1:32b

若 deepseek-r1:32b 的显存需求未超过单卡容量(如单卡 24GB),Ollama 不会自动启用多卡

在run一个8b的就可以看出来多卡了 

http://www.lryc.cn/news/2379974.html

相关文章:

  • HTML向四周扩散背景
  • 基于Java在高德地图面查询检索中使用WGS84坐标的一种方法-以某商场的POI数据检索为例
  • 使用 Terraform 创建 Azure Databricks
  • 本地部署dify+ragflow+deepseek ,结合小模型实现故障预测,并结合本地知识库和大模型给出维修建议
  • SECERN AI提出3D生成方法SVAD!单张图像合成超逼真3D Avatar!
  • 深入探索:Core Web Vitals 进阶优化与新兴指标
  • c/c++的opencv开闭操作
  • 【物联网】 ubantu20.04 搭建L2TP服务器
  • winrar 工具测试 下载 与安装
  • PLC组网的方法、要点及实施全解析
  • 网络安全深度解析:21种常见网站漏洞及防御指南
  • 【FAQ】HarmonyOS SDK 闭源开放能力 —Vision Kit (3)
  • Java大厂面试实战:Spring Boot与微服务场景中的技术点解析
  • 从零启动 Elasticsearch
  • 比较两个用于手写体识别的卷积神经网络(CNN)模型
  • Linux利用多线程和线程同步实现一个简单的聊天服务器
  • 【计网】作业5
  • 15、Python布尔逻辑全解析:运算符优先级、短路特性与实战避坑指南
  • Nginx基础知识
  • Vue-监听属性
  • python fastapi + react, 写一个图片 app
  • nginx集成防火墙ngx_waf的docker版
  • vscode c++编译onnxruntime cuda 出现的问题
  • sts下载安装
  • 中服云生产线自动化智能化调度生产系统:打造智能制造新标杆
  • next.js实现项目搭建
  • Redisson 四大核心机制实现原理详解
  • 云鼎入鼎系统:一站式电商管理解决方案
  • Leetcode134加油站
  • 关于Android Studio for Platform的使用记录