当前位置: 首页 > news >正文

用Ollama 和 Open WebUI本地部署Llama 3.1 8B

说明: 本人运行环境windows11 N卡6G显存。部署Llama3.1 8B

简介

  Ollama是一个开源的大型语言模型服务工具,它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和管理大型语言模型(LLM),使得用户能够快速地在本地运行这些模型。它简化了部署过程,通过简单的安装指令,用户可以执行一条命令就在本地运行开源大型语言模型,例如Llama 3.1。本地部署,离线运行,数据无需上传云端,担心隐私泄露。

1、下载Ollama安装

  官网地址:https://ollama.com/, 依据自己操作系统类型下载相应版本。

2、 下载Docker安装

  Open WebUI 在Docker环境中运行,下载Docker进行安装

  官网地址:https://www.docker.com/
在这里插入图片描述

3、在Docker中安装open-webui

  确认Docker已经运行。

  在Open WebUI 官网https://docs.openwebui.com/
在这里插入图片描述

  复制以下命令运行

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在这里插入图片描述

  执行完以上的命令,会在docker中出现open-webui项目。通过http://localhost:3000/打开Open WebUI界面。

在这里插入图片描述

4、浏览器中打开Open WebUI

  第一次登录,要求你注册,注册信息保存在本地。第一个注册的用户默认为系统管理员。注册完成后来到一个类似ChatGPT的界面。
在这里插入图片描述

5、设置拉取模型。

  在第③步中,可以访问https://ollama.com/library,在这里有很多常用的模型。

在这里插入图片描述
我这里选取的是llama3.1
在这里插入图片描述
复制命令在cmd下执行,拉取model,大约4.7G。稍等一会会。
在这里插入图片描述
在这里插入图片描述

或者复制大语言模型名称在Open WebUI中直接下载
在这里插入图片描述

  同样的方法,可以安装其它模型了。

6、选择模型,让我们开始吧!

  选择模型后,就可以对话了。

工作空间的简单应用

在这里插入图片描述
https://openwebui.com/可以选择相应预设模型,在页面中可以知道它采那个模型,还有相应的 System Prompt。
在这里插入图片描述
  综上所述,Ollama作为一个强大的开源大模型管理工具,它不仅能够助你高效地管理本地开源大模型,更能显著提升工作效率。通过其丰富的功能和灵活的配置选项,你可以轻松地组织、训练和调优各种模型,满足不同的应用需求。而Open WebUI的引入,提供了一个直观、便捷的Web界面,使你无需深入技术细节也能轻松访问和管理Ollama的接口。

http://www.lryc.cn/news/414348.html

相关文章:

  • 计算机毕业设计选题推荐-学生作业管理系统-Java/Python项目实战
  • RIP实验
  • 手把手教你如何在宝塔上添加可道云登录页面的ICP备案信息,别跟权威开玩笑。
  • 基于JSP技术的大学生校园兼职系统
  • VSCode在windows系统下的配置简单版
  • C++初学(9)
  • ardupilot开发 --- 网络技术综述 篇
  • 一文详解大模型蒸馏工具TextBrewer
  • Go语言加Vue3零基础入门全栈班10 Go语言+gRPC用户微服务项目实战 2024年07月31日 课程笔记
  • ChatGPT能代替网络作家吗?
  • Http自定义Header导致的跨域问题
  • python 中 file.read(), file.readline()和file.readlines()区别和用法
  • python 学习: np.pad
  • 等保2.0 | 人大金仓数据库测评
  • AIGC赋能智慧农业:用AI技术绘就作物生长新蓝图
  • yolov8蒸馏(附代码-免费)
  • Flink-StarRocks详解:第五部分查询数据湖(第55天)
  • 【MySQL】常用数据类型
  • 创建第一个rust tauri项目
  • 【课程总结】day19(中):Transformer架构及注意力机制了解
  • 4.4 标准正交基和格拉姆-施密特正交化
  • spring事务的8种失效的场景,7种传播行为
  • 进程的虚拟内存地址(C++程序的内存分区)
  • 英特尔移除超线程与AMD多线程性能对比
  • 定期自动巡检,及时发现机房运维管理中的潜在问题
  • 八股文(一)
  • 灵茶八题 - 子数组 ^w^
  • git clone private repo
  • vue3+ts+pinia+vant-项目搭建
  • 自动化测试概念篇