当前位置: 首页 > news >正文

指令微调与参数微调的代码实践与分析

文章目录

    • 指令微调的实验性分析
    • LoRA 代码实践与分析

    指令微调的示例代码与预训练的代码高度一致,区别主要在于指令微调数据集的构建(SFTDataset)和序列到序列损失的计算(DataCollatorForSupervisedDataset)。以下代码展示了 LLMBox 和 YuLan-Chat 中指令微调的整体训练流程。

1 import torch
2 from dataclasses import dataclass
3 from dataset.sft_dataset import SFTDataset
4 from transformers import (
5 		AutoModelForCausalLM,
6 		AutoTokenizer,
7 		HfArgumentParser,
8 		PreTrainedTokenizer,
9 		TrainingArguments,
10 		Trainer,
11 )
12 from transformers.hf_argparser import HfArg
13
14 IGNORE_INDEX = -100
15
16
17 # 用户输入超参数
18 @dataclass
19 class Arguments(TrainingArguments):
20 	# 模型结构
21 	model_name_or_path: str = HfArg(
22 		default=None,
23 		help="The model name or path, e.g., `meta-llama/Llama-2-7b-hf`",
24 	)
25
http://www.lryc.cn/news/433478.html

相关文章:

  • Android14音频进阶之高通Elite架构指定通道播放(八十四)
  • 常见的正则化方法以及L1,L2正则化的简单描述
  • 深入理解 Milvus:新一代向量数据库的基础技术与实战指南
  • Maven教程——从入门到入坑
  • 研究生深度学习入门的十天学习计划------第九天
  • perl的学习记录——仿真regression
  • 【Go】go连接clickhouse使用TCP协议
  • Emlog-Pro访问网站时需要密码验证插件
  • Apache ShardingSphere数据分片弹性伸缩加解密中间件
  • Django+Vue家居全屋定制系统的设计与实现
  • 如何把自动获取的ip地址固定
  • Java应用的数据库死锁问题分析与解决
  • ImportError: cannot import name ‘DglNodePropPredDataset‘ from ‘ogb.nodepropp
  • 基于SSM(Spring、SpringMVC、MyBatis)框架的高校信息管理系统
  • C++第一节入门
  • 全能型 AI 的崛起:未来的市场宠儿还是昙花一现?
  • 如何在PPT中插入已经绘制好的excel表格数据
  • 微积分直觉:隐含微分
  • Matlab自学笔记三十五:表table数据与外部文件的读入和写出
  • 闯关leetcode——3.Longest Substring Without Repeating Characters
  • Android Radio2.0——公告注册及监听(三)
  • 【C++】类和对象(三)再探构造函数|static成员函数|友元函数|内部类|匿名对象|对象拷贝时的编译优化
  • 2024中国算力大会 2024 China Computational Power Conference
  • jEasyUI 扩展行显示细节
  • YOLOv8+Deepsort+PyQt+GUI 语义分割+目标检测+姿态识别 三者合一(集成于一套系统)综合视觉分析系统
  • 机器学习无监督学习
  • windows10-VMware17-Ubuntu-22.04-海康2K摄像头兼容问题,求解(已解决)
  • 【系统架构设计师】解释器模式
  • Hive原理剖析
  • 在 Ubuntu 上查看重复文件