当前位置: 首页 > news >正文

本地模型导入ollama

文章目录

    • Modelfile模板
    • 导入到 ollama

Modelfile模板

在本地模型目录下创建 Modelfile

FROM ./qwen2.5-7b-instruct-q4_k_m.gguf# 设定温度参数为1 [更高的更具有创新性,更低的更富有连贯性]
PARAMETER temperature 1
# 将上下文窗口大小设置为4096,这控制着LLM能够使用多少个token来生成下一个token。
PARAMETER num_ctx 4096TEMPLATE """ {{- if .Messages }}
{{- if or .System .Tools }}<|im_start|>system
{{- if .System }}
{{ .System }}
{{- end }}
{{- if .Tools }}# ToolsYou may call one or more functions to assist with the user query.You are provided with function signatures within <tools></tools> XML tags:
<tools>
{{- range .Tools }}
{"type": "function", "function": {{ .Function }}}
{{- end }}
</tools>For each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:
<tool_call>
{"name": <function-name>, "arguments": <args-json-object>}
</tool_call>
{{- end }}<|im_end|>
{{ end }}
{{- range $i, $_ := .Messages }}
{{- $last := eq (len (slice $.Messages $i)) 1 -}}
{{- if eq .Role "user" }}<|im_start|>user
{{ .Content }}<|im_end|>
{{ else if eq .Role "assistant" }}<|im_start|>assistant
{{ if .Content }}{{ .Content }}
{{- else if .ToolCalls }}<tool_call>
{{ range .ToolCalls }}{"name": "{{ .Function.Name }}", "arguments": {{ .Function.Arguments }}}
{{ end }}</tool_call>
{{- end }}{{ if not $last }}<|im_end|>
{{ end }}
{{- else if eq .Role "tool" }}<|im_start|>user
<tool_response>
{{ .Content }}
</tool_response><|im_end|>
{{ end }}
{{- if and (ne .Role "assistant") $last }}<|im_start|>assistant
{{ end }}
{{- end }}
{{- else }}
{{- if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
{{ end }}{{ .Response }}{{ if .Response }}<|im_end|>{{ end }}
"""PARAMETER stop "<|im_start|>"
PARAMETER stop "<|im_end|>"

导入到 ollama

ollama create qwen2.5:7b -f Modelfile
http://www.lryc.cn/news/479080.html

相关文章:

  • scala Map训练
  • WorkFlow源码剖析——Communicator之TCPServer(下)
  • 数据结构与算法分析:专题内容——动态规划2之例题讲解(代码详解+万字长文+算法导论+力扣题)
  • 【Qt】QTreeView 和 QStandardItemModel的关系
  • containerd配置私有仓库registry
  • 深入解析语音识别中的关键技术:GMM、HMM、DNN和语言模型
  • C++循环引用
  • dayseven-因果分析-图模型与结构因果模型
  • 并发编程(8)—— std::async、std::future 源码解析
  • 稻米分类和病害检测数据集(猫脸码客 第237期)
  • HANDLINK ISS-7000v2 网关 login_handler.cgi 未授权RCE漏洞复现
  • 基于Multisim串联型连续可调直流稳压正电源电路设计与仿真
  • 【QT】Qt文件和多线程
  • PN结如何实现不同反向耐压及达到高反向耐压
  • 【bug日志-水】解决本地开发下代理和url同名导致刷新404的问题
  • Hive面试题-- 查询各类型专利 top10 申请人及专利申请数
  • 996引擎 - 活捉NPC
  • 航展畅想:从F35机载软件研发来看汽车车载软件研发
  • 用Dify搭建AI知识库
  • 架构师:如何提高web网站的请求并发响应量?
  • 图论基础--孤岛系列
  • Docker学习—Docker的安装与使用
  • HC-SR04超声波传感器详解(STM32)
  • 如何在BSV区块链上实现可验证AI
  • Python快速安装软件包到环境的方案
  • npm入门教程17:准备发布的npm包
  • 协程1 --- 发展历史
  • VBA10-处理Excel的动态数据区域
  • 【git】使用记录
  • 代码随想录算法训练营第三十八天|Day38 动态规划