当前位置: 首页 > news >正文

自己微调的大模型如何用ollama运行

在 Ollama 中运行自己微调的 GGUF 模型

本文档介绍如何将本地微调好的 GGUF 格式模型(例如 LLaMA、Qwen、Mistral 等)加载到 Ollama 并运行。


1. 准备模型文件

  • 确保你已经有一个微调好的 .gguf 模型文件,例如:

\~/my\_ollama\_models/qwen3-14b-finetuned.gguf
  • 路径可以放在:
  • Ollama 默认目录(如 ~/.ollama/models/var/snap/ollama/common/models/blobs
  • 或自己新建的目录(推荐),例如 ~/my_ollama_models/

2. 创建 Modelfile

在同级目录下新建一个文件 Modelfile,内容如下:

from /home/yourname/my_ollama_models/qwen3-14b-finetuned.ggufsystem """
你是一个专业的助手
"""template """
用戶: {{ .Prompt }}
助手:
"""parameter temperature 0.7
parameter top_p 0.9

说明:

  • from → 指定本地 gguf 模型路径
  • system → 定义系统角色(模型身份)
  • template → 定义对话格式(如何组织提示词)
  • parameter → 设置推理参数

3. 使用 Ollama 注册模型

在 Modelfile 所在目录运行:

ollama create myqwen -f Modelfile

这样就会创建一个名为 myqwen 的模型。


4. 运行自定义模型

启动推理:

ollama run myqwen

5. 常用调优方法

  • 修改 parameter 控制生成效果,例如:

    parameter temperature 0.5
    parameter num_ctx 4096
    parameter top_k 50
    
  • 可以在 system 里定义更多身份设定,例如:

    system """
    你是一位農場管理顧問,擅長給出豬舍與牛舍環境控制的建議。
    """
    

6. 模型管理

  • 查看本地已有模型:

    ollama list
    
  • 删除自定义模型:

    ollama rm myqwen
    
  • 如果需要迁移,只需复制 gguf 文件 + Modelfile 到新环境,再 ollama create 即可。


✅ 总结

  1. 准备好 .gguf 模型文件
  2. 写一个 Modelfile 指定路径和推理参数
  3. ollama create 注册
  4. ollama run 调用

这样你就能在 Ollama 中运行自己微调的大模型,并像官方模型一样使用了。

http://www.lryc.cn/news/626567.html

相关文章:

  • Android 开发问题:android:marginTop=“20px“ 属性不生效
  • 数字化图书管理系统设计实践(java)
  • Redis 复制功能是如何工作的
  • Linux I/O 多路复用实战:Select/Poll 编程指南
  • iOS 应用上架常见问题与解决方案,多工具组合的实战经验
  • Redis--day9--黑马点评--分布式锁(二)
  • C++ 数据结构 和 STL
  • 大数据毕业设计选题推荐-基于大数据的1688商品类目关系分析与可视化系统-Hadoop-Spark-数据可视化-BigData
  • wpf之ComboBox
  • 软件测试面试题真题分享
  • 数据挖掘笔记:点到线段的距离计算
  • 百度Q2财报:总营收327亿 AI新业务收入首次超100亿
  • PDF如何在Adobe Acrobat 中用OCR光学识别文档并保存可编辑文档
  • 【鸿蒙心迹】7×24小时极限求生:当Origin_null遇上鸿蒙,我如何用100杯咖啡换一条跨域活路?
  • 环境搭建:centos7+docker+Oracle
  • 【Day 30】Linux-SQL语句
  • 【爬虫实战-IP代理的重要性二】 以Selenium为例
  • 高通 XR 系列芯介绍
  • 发那科机器人程序调整功能
  • 搭建一个SpringBoot项目的流程
  • 05-网关服务开发指南
  • 使用Spring Retry组件优雅地实现重试
  • 【网络】使用 DNAT 进行负载均衡时,若未配置配套的 SNAT,回包失败
  • 数字IC后端设计实现常见后端问题解析
  • 面试官视角分析与提问点
  • SpringBoot3 Ruoyi芋道管理后台vben5.0
  • 【Express零基础入门】 | 构建简易后端服务的核心知识
  • 【Java后端】Spring Boot 全局异常处理最佳实践
  • ssl代理
  • SED项目复现学习实录