当前位置: 首页 > news >正文

【GPT入门】第47课 LlamaFacotory 合并原模型与LoRA模型

【GPT入门】第47课 LlamaFacotory 合并原模型与LoRA模型

  • 1.合并原模型与LoRA训练的增量模型
  • 2. 测试模型

1.合并原模型与LoRA训练的增量模型

  • llamafactory-cli webui 执行合并

在这里插入图片描述

  • 合并后模型大小
(base) root@autodl-container-b4b04ea4f2-b5ee47d1:~# du -sh  /root/autodl-tmp/models/*
15G     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1
15G     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged
15G     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui
  • 模型文件详情
(base) root@autodl-container-b4b04ea4f2-b5ee47d1:~# du -sh  /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/*
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/Modelfile
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/chat_template.jinja
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/config.json
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/generation_config.json
4.7G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00001-of-00004.safetensors
4.7G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00002-of-00004.safetensors
4.6G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00003-of-00004.safetensors
1.1G    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model-00004-of-00004.safetensors
24K     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/model.safetensors.index.json
4.0K    /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/special_tokens_map.json
17M     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/tokenizer.json
52K     /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1-merged-ui/tokenizer_config.json

2. 测试模型

在这里插入图片描述
在这里插入图片描述

http://www.lryc.cn/news/624192.html

相关文章:

  • Navicat 无法登录时找回 SQL 文件的方法
  • Zephyr 中的 bt_le_per_adv_set_data 函数的介绍和应用方法
  • RK3568 NPU RKNN(六):RKNPU2 SDK
  • c++之static和const
  • Zephyr 中 BT_GATT_SERVICE_DEFINE 使用详解
  • 面向R语言用户的Highcharts
  • 【1:1复刻R版】python版火山图函数一键出图
  • Zephyr下控制ESP32S3的GPIO口
  • 生信分析自学攻略 | R软件和Rstudio的安装
  • 抗辐照CANFD通信芯片在高安全领域国产化替代的研究
  • Android系统模块编译调试与Ninja使用指南
  • 网络通信的基本概念与设备
  • 网络常识-SSE对比Websocket
  • MYSQL-175. 组合两个表
  • STM32学习笔记13-通信协议I2CMPU6050
  • 半敏捷卫星观测调度系统的设计与实现
  • MySQL的事务日志:
  • 智能汽车领域研发,复用云原生开发范式?
  • Redis--day7--黑马点评--优惠券秒杀
  • 超市电商销售分析项目:从数据分析到业务决策
  • linux下timerfd和posix timer为什么存在较大的抖动?
  • 达梦数据库常见的重要巡检语句
  • 线程(基本概念和相关命令)
  • 重温k8s基础概念知识系列三(工作负载)
  • Linux设备模型深度解析
  • Rust Async 异步编程(五):执行器和系统 I/O
  • Python可视化工具-Bokeh:动态显示数据
  • java_spring boot 中使用 log4j2 及 自定义layout设置示例
  • 【Java后端】MyBatis-Plus 原理解析
  • 股票术语:“支撑位”