当前位置: 首页 > news >正文

Xtuner大模型微调

Xtuner大模型微调

一、课程笔记

文档链接:https://github.com/InternLM/tutorial/blob/main/xtuner/README.md
视频链接: https://www.bilibili.com/video/BV1yK4y1B75J/

大模型微调

大模型的训练利用了各类数据,可以说是一个通才,但是在某个专业领域是很缺乏知识储备的,除了用RAG算法给LLM增加知识外挂,还可以用微调(fine tuning)的方式把专业知识教给LLM。如果说RAG是一边答题一边查书的开卷考试,微调就是送这个啥知识都知道一些的通才去学一个专业,专业领域内的成为专才。

XTuner微调工具

微调大模型需要相关的软件工具,用来导入各种数据集,训练各类大模型,XTuner就是这样的工具。XTuner包含了主流开源大模型(baichuan、chatglm、internlm、llama、qwen)的微调配置文件,开箱即用,一行命令就可以启动微调。

二、作业实践

基础作业:

构建数据集,使用 XTuner 微调 InternLM-Chat-7B 模型, 让模型学习到它是你的智能小助手,效果如下图所示,本作业训练出来的模型的输出需要将不要葱姜蒜大佬替换成自己名字或昵称!

作业参考答案:https://github.com/InternLM/tutorial/blob/main/xtuner/self.md

微调前:
在这里插入图片描述

微调的epoch设置为1,打印日志显示,微调没有起作用:
在这里插入图片描述

把epoch设置为3,到了epoch1的后半期,微调起了作用:

在这里插入图片描述

跑完epoch1后,中断微调训练,直接导出epoch跑出的模型文件,启动web界面运行:
在这里插入图片描述

http://www.lryc.cn/news/279992.html

相关文章:

  • JavaScript基础04
  • HarmonyOS@Observed装饰器和@ObjectLink装饰器:嵌套类对象属性变化
  • x-cmd pkg | jless - 受 Vim 启发的命令行 JSON 查看器
  • 【HuggingFace Transformer库学习笔记】基础组件学习:Datasets
  • [机缘参悟-126] :实修 - 从系统论角度理解自洽的人生:和谐、稳定,不拧巴,不焦虑,不纠结
  • 慢 SQL 的优化思路
  • 强化学习(一)简介
  • 外贸常用网站
  • Android中集成FFmpeg及NDK基础知识
  • 1.13寒假集训
  • 删除排序链表中的重复元素
  • echarts的dispatchAction
  • Java IO学习和总结(超详细)
  • mysql忘记root密码后怎么重置
  • 计算机图形学作业:三维线段的图形变换
  • Linux mren命令教程:批量重命名文件(附实际操作案例和注意事项)
  • LLVM系列(1): 在微软Visual Studio下编译LLVM
  • 分布式系统的三字真经CAP
  • 大模型背景下计算机视觉年终思考小结(一)
  • Modbus协议学习第一篇之基础概念
  • gem5学习(12):理解gem5 统计信息和输出——Understanding gem5 statistics and output
  • 索引的概述和使用
  • 力扣210. 课程表 II
  • [Docker] Mac M1系列芯片上完美运行Docker
  • CompletableFuture、ListenableFuture高级用列
  • 什么是云服务器,阿里云优势如何?
  • HCIA-Datacom题库(自己整理分类的)_15_VRP平台多选【9道题】
  • html5基础入门
  • JVM工作原理与实战(十五):运行时数据区-程序计数器
  • 计算机体系结构----存储系统