当前位置: 首页 > news >正文

大模型管理工具:Ollama

目录

一、Ollama 介绍

二、Linux 安装 Ollama

2.1 一键安装

2.2 手动安装

三、使用Ollama

3.1 配置模型下载路径

3.2 运行模型

3.3 常用命令

四、模型管理

4.1 官方模型库

4.2 导入自定义模型

五、REST API

六、Web UI


一、Ollama 介绍

        Ollama 是一个基于 Go 语言开发的可以本地运行大模型的开源框架,同时提供 REST API 管理和使用大模型。 

二、Linux 安装 Ollama

2.1 一键安装

#安装

curl -fsSL https://ollama.com/install.sh | sh

#更新:再次执行安装脚本即可更新

curl -fsSL https://ollama.com/install.sh | sh

2.2 手动安装

        1.下载Ollama二进制文件

curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama

        2.修改文件权限

chmod +x /usr/bin/ollama

        3.创建ollama用户

sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama

        4.创建系统服务文件

vi /etc/systemd/system/ollama.service

[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3

[Install]
WantedBy=default.target

        5.启用服务

systemctl daemon-reload
systemctl enable ollama

        6.启动Ollama

systemctl start ollama

        7.更新Ollama

#重新下载二进制文件即可

curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
chmod +x /usr/bin/ollama

        8.删除Ollama

        具体操作查看官方文档。

三、使用Ollama

3.1 配置模型下载路径

export OLLAMA_MODELS=/data/weisx/ollama

3.2 运行模型

#第一次执行会下载模型到本地

ollama run llama3

3.3 常用命令

        创建模型:

ollama create mymodel -f ./Modelfile

        删除模型:

ollama rm llama3

        复制模型:

ollama cp llama3 my-model

        查看模型:

ollama list

        运行模型:

ollama run llama3

四、模型管理

4.1 官方模型库

        可访问官网查看模型列表,以下是一些常用模型示例:

ModelParametersSizeDownload
Llama 38B4.7GBollama run llama3
Llama 370B40GBollama run llama3:70b

4.2 导入自定义模型

        途径1:从GGUF导入

        1.下载GGUF文件

#Huggingface网站下载模型的GGUF

https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit

        2、创建Modelfile文件

vi Modelfile

#使用FROM指令导入本地模型

FROM ./Llama3-8B-Chinese-Chat-GGUF-8bit.gguf

#Modelfile文件中还可以添加系统提示词以及各项参数

        3. 创建模型

ollama create example -f Modelfile

        4.运行模型

ollama run example

        途径2:从PyTorch或Safetensors导入

        具体操作请参阅关于导入模型的指南。

五、REST API

https://github.com/ollama/ollama/blob/main/docs/api.md

六、Web UI

https://github.com/open-webui/open-webui

http://www.lryc.cn/news/348701.html

相关文章:

  • recycleView的item,TV正确方式获取焦点,以及刷新界面
  • QT内存管理机制
  • 亚马逊卖家,如何打造爆款,如何提高产品权重、曝光、流量?
  • 处理HTTP请求的服务器
  • 打造本地GPT专业领域知识库AnythingLLM+Ollama
  • 数据可视化训练第6天(美国人口调查获得关于收入与教育背景的数据,并且可视化)
  • 如何更换远程服务器的Python版本
  • Python 运筹优化13 Thompson Sampling 解读
  • 计算机毕业设计 | SpringBoot健身房管理系统(附源码)
  • 大模型LLM 结合联网搜索增强isou
  • 软删除和硬删除的区别及实际应用
  • 算法加密-简介
  • 搞懂Docker(九)- 使用Docker Compose
  • EOCRSP-40NM7施耐德电机保护器EOCR-SP
  • 一文带你快速了解GPT-4o!内含免费使用指南!
  • react18【系列实用教程】useState (2024最新版)
  • 电商选品的数据是可以用爬虫进行采集的吗?
  • 数据特征降维 | 局部线性嵌入(LLE)
  • js发票查验、票据OCR接口助力解决发票录入与真假辨别难题
  • HTML静态网页成品作业(HTML+CSS+JS)——华为商城网页(1个页面)
  • 【吃透Java手写】5-RPC-简易版
  • express 本地https服务 接口、静态文件,并支持跨域
  • 从零手写实现 tomcat-08-tomcat 如何与 springboot 集成?
  • yarn 安装以及报错处理
  • 31万奖金池等你挑战!IJCAI 2024 第九届“信也科技杯”全球AI算法大赛正式开赛!聚焦AI尖端赛题!
  • 线性表—栈的实现
  • react+antd --- 日期选择器,动态生成日期表格表头
  • webgl入门-js与着色器间的数据传输
  • springmvc异常处理
  • 可拖动、连线的React画布组件有哪些? 官网分别是什么?