当前位置: 首页 > news >正文

本地部署DeepSeek R1 + 界面可视化open-webui【ollama容器+open-webui容器】

本地部署DeepSeek R1 + 界面可视化open-webui

本文主要讲述如何用ollama镜像和open-webui镜像部署DeepSeek R1, 镜像比较方便我们在各个机器之间快速部署。

显卡推荐

模型版本CPU内存GPU显卡推荐
1.5B4核+8GB+非必需4GB+RTX1650、RTX2060
7B、8B8核+16GB+8GB+RTX3070、RTX4060
14B12核+32GB+16GB+RTX4090、RTX5080
32B16核+64GB+24GB+A100 40GB
70B32核+128GB+多卡2×A100 80GB
671B64核+512GB+多卡8×A100/H100

以上配置仅供参考

安裝部署ollama镜像

进入 ollama镜像官网 | https://hub.docker.com/r/ollama/ollama,选择Download
在这里插入图片描述
镜像是部署在ubuntu系统上的,请确保已经安装好docker和NVIDIA Container Toolkit等系统环境。

拉取启动镜像

创建一个目录,用来保存ollama下载下来的模型

mkdir -p ollama/data
cd ollama/

只有CPU的情况下:

sudo docker run -d -v ./data:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

有GPU的情况下:

sudo docker run -d --gpus=all -v ./data:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

制作成docker-compose 文件管理镜像

version: '3.8'services:ollama:image: ollama/ollamacontainer_name: ollamarestart: alwaysvolumes:- ./data:/root/.ollamaports:- "11434:11434"

安裝部署open-webui镜像

  • Open WebUI Github
  • Open WebUI Document
echo 'export OLLAMA_HOST=0.0.0.0' >> ~/.bashrc
source ~/.bashrc

拉取并启动镜像

  • 启动
    docker会先拉取镜像,再启动
sudo docker run --network=host -v /work/open-webui/open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main

制作成docker-compose 文件管理镜像

version: '3.8'services:open-webui:image: ghcr.io/open-webui/open-webui:maincontainer_name: open-webuirestart: alwaysnetwork_mode: hostvolumes:- /work/open-webui/open-webui:/app/backend/dataenvironment:- OLLAMA_BASE_URL=http://127.0.0.1:11434# Optionally add ports or other configurations if neededports:- "8080:8080"

启动镜像

sudo docker-compose up

进入设置界面,配置ollama服务地址
在这里插入图片描述
链接过程中遇到故障 服务器连接问题

下载模型

进入到 open-webui的主页,点击 + 号,添加模型
在这里插入图片描述
搜索模型,输入deepseek-r1:32b,或其他版本的模型,下载模型需要等待,请耐心等待模型下载完整。
在这里插入图片描述

开始进入搜嘎模型:
在这里插入图片描述

END


在这里插入图片描述

http://www.lryc.cn/news/540455.html

相关文章:

  • macOS部署DeepSeek-r1
  • 基于STM32与BD623x的电机控制实战——从零搭建无人机/机器人驱动系统
  • 基于ffmpeg+openGL ES实现的视频编辑工具-字幕添加(六)
  • C++中const T为什么少见?它有什么用途?
  • Leetcode 位计算
  • SpringBoot3.x整合WebSocket
  • 猿大师办公助手对比其他WebOffice在线编辑Office插件有什么优势
  • STM32创建静态库lib
  • Hive JOIN过滤条件位置玄学:ON vs WHERE的量子纠缠
  • MAC快速本地部署Deepseek (win也可以)
  • javaEE-13.spring MVC
  • C/C++ | 每日一练 (2)
  • Nginx 常用命令和部署详解及案例示范
  • GO大模型应用开发框架-
  • 保姆级!springboot访问Ollama API并调用DeepSeek模型 Api
  • 力扣hot100 ——搜索二维矩阵 || m+n复杂度优化解法
  • 娱乐使用,可以生成转账、图片、聊天等对话内容
  • 【PyQt5】python可视化开发:PyQt5介绍,开发环境搭建快速入门
  • 使用 FFmpeg 剪辑视频指南
  • AWS云从业者认证题库 AWS Cloud Practitioner
  • 高性能内存对象缓存Memcached详细实验操作
  • 【C++复习专题】—— 类和对象,包含类的引入、访问限定符、类的6个默认成员函数等
  • Three.js 快速入门教程【一】开启你的 3D Web 开发之旅
  • Windows 图形显示驱动开发-CPU 内存调节和64KB 页面支持
  • PLC通信交互系统技术分享
  • ceph HEALTH_WARN clock skew detected on mon.f, mon.o, mon.p, mon.q
  • Git命令行入门
  • pdf-extract-kit paddle paddleocr pdf2markdown.py(效果不佳)
  • Android 10.0 移除wifi功能及相关菜单
  • 什么是Dubbo?Dubbo框架知识点,面试题总结