当前位置：首页 > news >正文

指令微调与参数微调的代码实践与分析

news 2025/6/26 17:15:08

文章目录

- 指令微调的实验性分析
- LoRA 代码实践与分析

指令微调的示例代码与预训练的代码高度一致，区别主要在于指令微调数据集的构建（SFTDataset）和序列到序列损失的计算（DataCollatorForSupervisedDataset）。以下代码展示了 LLMBox 和 YuLan-Chat 中指令微调的整体训练流程。

1 import torch
2 from dataclasses import dataclass
3 from dataset.sft_dataset import SFTDataset
4 from transformers import (
5 		AutoModelForCausalLM,
6 		AutoTokenizer,
7 		HfArgumentParser,
8 		PreTrainedTokenizer,
9 		TrainingArguments,
10 		Trainer,
11 )
12 from transformers.hf_argparser import HfArg
13
14 IGNORE_INDEX = -100
15
16
17 # 用户输入超参数
18 @dataclass
19 class Arguments(TrainingArguments):
20 	# 模型结构
21 	model_name_or_path: str = HfArg(
22 		default=None,
23 		help="The model name or path, e.g., `meta-llama/Llama-2-7b-hf`",
24 	)
25

http://www.lryc.cn/news/433478.html

相关文章：

Android14音频进阶之高通Elite架构指定通道播放(八十四)

常见的正则化方法以及L1，L2正则化的简单描述

深入理解 Milvus：新一代向量数据库的基础技术与实战指南

Maven教程——从入门到入坑

研究生深度学习入门的十天学习计划------第九天

perl的学习记录——仿真regression

【Go】go连接clickhouse使用TCP协议

Emlog-Pro访问网站时需要密码验证插件

Apache ShardingSphere数据分片弹性伸缩加解密中间件

Django+Vue家居全屋定制系统的设计与实现

如何把自动获取的ip地址固定

Java应用的数据库死锁问题分析与解决

ImportError: cannot import name ‘DglNodePropPredDataset‘ from ‘ogb.nodepropp

基于SSM（Spring、SpringMVC、MyBatis）框架的高校信息管理系统

C++第一节入门

全能型 AI 的崛起：未来的市场宠儿还是昙花一现？

如何在PPT中插入已经绘制好的excel表格数据

微积分直觉：隐含微分

Matlab自学笔记三十五：表table数据与外部文件的读入和写出

闯关leetcode——3.Longest Substring Without Repeating Characters

Android Radio2.0——公告注册及监听（三）

【C++】类和对象（三）再探构造函数|static成员函数|友元函数|内部类|匿名对象|对象拷贝时的编译优化

2024中国算力大会 2024 China Computational Power Conference

jEasyUI 扩展行显示细节

YOLOv8+Deepsort+PyQt+GUI 语义分割+目标检测+姿态识别三者合一（集成于一套系统）综合视觉分析系统

机器学习无监督学习

windows10-VMware17-Ubuntu-22.04-海康2K摄像头兼容问题，求解(已解决)

【系统架构设计师】解释器模式

Hive原理剖析

在 Ubuntu 上查看重复文件