当前位置: 首页 > news >正文

如何自己构建 Ollama 模型

如何自己构建 Ollama 模型

  • 0. 引言
  • 1. 下载原始模型
  • 2. 创建 Modelfile 文件
  • 3. 构建 Ollama 模型
  • 4. 运行自构建的 Ollama 模型

0. 引言

针对模型新出的大模型,可能 Ollama Models Library 不提供,或者会在今后的某个时点提供。还有可能 Ollama Models Library 提供的模型有问题,或者我们想加入一些客户化的内容。上面这些情况,我们可能都需要自己构建一个 Ollama 模型。

今天我会以一个示例演示一下如何构建一个客户化 Ollama 模型。

1. 下载原始模型

今天的示例模型是 CohereForAI/c4ai-command-r-v01,我们先搜寻 gguf 格式的模型文件,找到这个链接,https://huggingface.co/andrewcanis/c4ai-command-r-v01-GGUF/tree/main,我们下载想使用的量化版本,比如,c4ai-command-r-v01-Q8_0.gguf

在这里插入图片描述

2. 创建 Modelfile 文件

创建一个 Modelfile 文件,比如 c4ai-command-r-v01-Q8_0.Modelfile,内容如下,

TEMPLATE 和 PARAMETER 的内容如何定义,需要查看各个模型页面的相关说明。

FROM ./c4ai-command-r-v01-Q8_0.gguf
TEMPLATE """<BOS_TOKEN>{{ if .System }}<|START_OF_TURN_TOKEN|><|SYSTEM_TOKEN|>{{ .System }}<|END_OF_TURN_TOKEN|>{{ end }}{{ if .Prompt }}<|START_OF_TURN_TOKEN|><|USER_TOKEN|>{{ .Prompt }}<|END_OF_TURN_TOKEN|>{{ end }}<|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>{{ .Response }}"""
PARAMETER stop "<|END_OF_TURN_TOKEN|>"

refer: https://github.com/ollama/ollama?tab=readme-ov-file
refer: https://github.com/ollama/ollama/pull/3190

3. 构建 Ollama 模型

执行下面命令构建 Ollama 模型,这个过程会花费一些时间,

ollama create cohereforai:c4ai-command-r-v01-Q8_0 -f .\c4ai-command-r-v01-Q8_0.Modelfile

在这里插入图片描述

4. 运行自构建的 Ollama 模型

通过 ollama run 模型运行自构建的 Ollama 模型,

ollama run cohereforai:c4ai-command-r-v01-Q8_0

在这里插入图片描述

完结!

http://www.lryc.cn/news/323557.html

相关文章:

  • 5.84 BCC工具之tcpretrans.py解读
  • 从0到1实现RPC | 03 重载方法和参数类型转换
  • Matlab之已知2点绘制长度可定义的射线
  • 虚拟机安装Linux系统,FinalShell远程连接Linux
  • MacOS Xcode 使用LLDB调试Qt的 QString
  • C/C++代码性能优化——编程实践
  • JVM—内存可见性
  • VScode手动安装vsix格式插件,提示安装插件与code版本不兼容问题
  • K8S Storage
  • Day54-nginx限速-访问日志-错误日志精讲
  • SQL经典面试题
  • Java基础知识总结(14)
  • MacOS - GCC 版本升级解决方案
  • 小程序绕过 sign 签名
  • 【Canvas与艺术】绘制动态太极图
  • Llama 2 模型
  • SQLiteC/C++接口详细介绍sqlite3_stmt类(十一)
  • 【理解机器学习算法】之Clustering算法(Agglomerative Clustering)
  • 千帆AppBuilder开发参考-应用API调用说明
  • python自定义日历库,与对应calendar库函数功能基本一致
  • css3鼠标悬停图片特效,图片悬停效果源码
  • 使用CSS3画出一个叮当猫HTML源码
  • Spring Boot 自动化单元测试类的编写过程
  • 复试专业前沿问题问答合集8-3——RNN、Hadoop、GPT大语言模型
  • 序列的使用
  • golang kafka sarama 源码解析
  • Flutter知识点整理
  • 现代游戏引擎架构
  • 深度学习:复杂工业场景下的复杂缺陷检测方法
  • CSDN个人简介优化 html font属性