当前位置: 首页 > news >正文

Llama微调以及Ollama部署

1 Llama微调

在基础模型的基础上,通过一些特定的数据集,将具有特定功能加在原有的模型上。

1.1 效果对比

  • 特定数据集
    在这里插入图片描述
  • 未使用微调的基础模型的回答
    在这里插入图片描述
  • 使用微调后的回答
    在这里插入图片描述

1.2 基础模型

基础大模型我选择Mistral-7B-v0.3-Chinese-Chat-uncensored,
模型文件可以在HuggingFace 模型

1.3 选择数据集

微调大模型要想获得比较好的效果,拥有高质量的数据集是关键。可以选择用网上开源的,或者是自己制作。以中文数据集弱智吧为例,约1500条对话数据,数据集可以从HuggingFace 数据集

1.4 训练lora模型并与基础模型进行合并

新建一个merge.py文件,将基础模型和lora模型合并为一个新的模型文件

执行merge.py,需要传入的参数(改成自己的):
--base_model
基础模型路径
--lora_model
微调的lora模型路径
--output_dir
合并后模型的输出路径

1.5 量化模型

利用llama.cpp进行量化模型.

  • 1.安装CMAKE下载llama.cpp源码
    git clone https://github.com/ggerganov/llama.cpp.git
    cd llama.cpp
  • 2.安装依赖
    pip install -r requirements/requirements-convert-hf-to-gguf.txt
    cmake -B build
    cmake --build build --config Release
  • 3.执行转换脚本,将safetensors转换为gguf文件,便于量化
    convert-hf-to-gguf.py 合并后模型的位置 --outtype f16 --outfile 转换后模型的位置my_llama3.gguf
  • 4.对转后的文件进行量化操作。
    llama.cpp所在位置\llama.cpp\build\bin\Release quantize.exe 转换后模型的路径 量化后模型的位置quantized_model.gguf q4_0

至此,llama微调后的模型操作完毕,可以直接使用。

2.Ollama部署

Ollama安装地址

2.1 部署现有的模型

在这里插入图片描述
打开Ollama,找到目录中现有的模型,使用ollama run llama3.2,来使用现有模型。

2.2 使用微调模型

  • 1.在上述已量化好的模型quantized_model.gguf的目录中新建Modelfile文件
FROM 量化好的模型路径
TEMPLATE "[INST] {{ .Prompt }} [/INST]"
  • 2.使用微调模型
# ollama create 模型名字 -f Modelfile文件路径
ollama create panda -f  test.Modelfile
http://www.lryc.cn/news/450275.html

相关文章:

  • 中关村环球时尚产业联盟 东晟时尚产业创新中心成立
  • 基于SSM的宠物领养管理系统的设计与实现 (含源码+sql+视频导入教程+文档+PPT)
  • 为什么要配置环境变量?
  • 条件熵公式详细解释、举例说明计算步骤
  • 颍川陈氏始祖陈寔逆势崛起的原由(一)不屈的努力
  • golang小项目1-家庭收支记账系统
  • Visual Studio Code下载安装及汉化
  • MySQL—触发器详解
  • 钉钉H5微应用Springboot+Vue开发分享
  • 项目:微服务即时通讯系统客户端(基于C++QT)]四,中间界面搭建和逻辑准备
  • 【C语言】指针详解(一)
  • unity3D雨雪等粒子特效不穿透房屋效果实现(粒子不穿透模型)
  • ROS2安装cartographer
  • kafka测试
  • 总结C/C++中内存区域划分
  • 第168天:应急响应-ELK 日志分析系统Yara规则样本识别特征提取规则编写
  • MySQL 面试题及答案
  • vue仿chatGpt的AI聊天功能--大模型通义千问(阿里云)
  • 养老院管理系统(含源码+sql+视频导入教程+文档)
  • 大数据的挑战是小文件
  • 迁移学习案例-python代码
  • MCUboot 和 U-Boot区别
  • Apache OFBiz SSRF漏洞CVE-2024-45507分析
  • 计算机毕业设计 饮食营养管理信息系统的设计与实现 Java实战项目 附源码+文档+视频讲解
  • 828华为云征文|华为云Flexus云服务器X实例部署——盲盒抽奖商城系统以及编译发布小程序
  • 优化理论及应用精解【12】
  • excel 填充内容的公式
  • 这款工具在手,前端开发轻松搞定!
  • Hadoop三大组件之HDFS(一)
  • 基于Hadoop的NBA球员大数据分析及可视化系统