当前位置: 首页 > news >正文

linux,ubuntu,使用ollama本地部署大模型llama3,模型通用,简易快速安装

文章目录

  • 前言
  • 安装ollama
  • 启动ollama
  • 运行llama3模型
  • 查看ollama列表
  • 删除模型
  • 通过代码进行调用
  • REST API

前言

在拥有了一条4090显卡后,那冗余的性能让你不得不去想着办法整花活,于是就想着部署个llama3,于是发现了ollama这个新大陆,废话不多说,直接上操作,对于系统的安装和4090驱动的安装可以查看简易教程:
linux系统安装:U盘安装Ubuntu24.04,乌邦图,UltralISO
linux驱动显卡:linux系统,ubuntu安装英伟达NVIDIA4090显卡驱动
对于llama3的说明可以查看官方:https://ai.meta.com/blog/meta-llama-3-1

安装ollama

curl -fsSL https://ollama.com/install.sh | sh
  • 直接一步到位安装完成

启动ollama

ollama serve

运行llama3模型

  • 8B 版本最低仅需 4GB 显存即可运行,这也是我们主要选择的
  • 70B 一条4090支撑,跑起来的模型回答问题会很慢
  • 405B 商用级别的,不是业余爱好者能应用的
  • 模型如果不存在,会自行进行拉取
ollama run llama3.1:8b 
  • 出现以下画面。即表示模型已运行,并且可以直接进行提问
    在这里插入图片描述
  • 退出:ctrl + d

查看ollama列表

ollama list

在这里插入图片描述

删除模型

仅作指令展示,别刚安装完就删除了

ollama rm llama3.1:8b

通过代码进行调用

from openai import OpenAI
base_url = 'http://localhost:11434/v1/'
api_key = 'ollama'
client = OpenAI(base_url=base_url, api_key=api_key)
chat_completion = client.chat.completions.create(messages=[{'role':'user', 'content':'你好,请介绍下你自己'}],model='llama3.1:8b',
)
data = chat_completion.choices[0].message.content
print(data)
  • 执行效果不错
    在这里插入图片描述

REST API

Ollama 提供了用于运行和管理模型的 REST API。

  1. 生成响应
curl http://localhost:11434/api/generate -d '{"model": "llama3.1:8b","prompt":"Why is the sky blue?"
}'
  1. 与模型交流
curl http://localhost:11434/api/chat -d '{"model": "llama3.1:8b","messages": [{ "role": "user", "content": "why is the sky blue?" }]
}'
http://www.lryc.cn/news/430550.html

相关文章:

  • JS中的encodeURIComponent函数示例
  • 8.20 pre day bug
  • 位运算专题
  • HaProxy学习 —300K的TCP Socket并发连接实现(翻译)
  • 92.WEB渗透测试-信息收集-Google语法(6)
  • [数据集][目标检测]木材缺陷检测数据集VOC+YOLO格式2383张10类别
  • 【启明智显分享】智能音箱AI大模型一站式解决方案重塑人机交互体验,2个月高效落地
  • 逻辑与集合论基础及其在编程中的应用
  • 【无标题】为什么 pg_rewind 在 PostgreSQL 中很重要?
  • hostapd生成beacon_ie
  • leetcode349:两个数组的交集
  • Metasploit漏洞利用系列(八):MSF渗透测试 - PHPCGI漏洞利用实战
  • 基于python的主观题自动阅卷系统设计与实现
  • 计算机毕业设计仪器设备管理系统-折旧-报废-转移-借出-归还
  • DAY37
  • 将iso格式的镜像文件转化成云平台能安装的镜像格式(raw/vhd/QCOW2/VMDK )亲测--图文详解
  • Numba加速计算(CPU + GPU + prange)
  • electron 两个渲染进程之间通信
  • 配置ROS环境
  • 力扣 128. 最长连续序列
  • Stable Diffusion AI绘画工具的安装与配置(MAC用户)
  • flowable源码解读——并行多实例节点任务是否是顺序生成
  • 【机器学习】AGI的基本概念、技术挑战和应用前景
  • flink 使用RocksDB作为状态后端
  • 【运维高级内容--MySQL】
  • 【仿真与实物设计】基于51单片机设计的打地鼠游戏机——程序源码原理图proteus仿真图PCB设计文档演示视频元件清单等(文末工程资料下载)
  • iPhone设备使用技巧:忘记密码的情况下如何解除iOS 18/17屏幕时间
  • 内网渗透的风行者—Yasso
  • Android13 app后台无法启动Abort background activity starts from
  • Day45 | 99.岛屿数量 深搜 广搜 100.岛屿的最大面积