当前位置: 首页 > news >正文

语言大模型基础概念 一(先了解听说过的名词都是什么)

SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别

STF(Supervised Fine-Tuning)和RLHF(Reinforcement Learning from Human Feedback)是两种不同的模型训练方法,分别用于不同的阶段和目的。具体介绍参考SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别_sft和rlhf-CSDN博客

LoRA(Low-Rank Adaptation)

Lora(Low-Rank Adaptation)是一种新的模型微调技术。在预训练好的模型中引入并行的低秩矩阵,用于修正预训练模型的输出(有点像ResNet,增加新的参数用来生成预训练模型的残差)。具体介绍参考理解Lora微调只需一个公式-CSDN博客

语言大模型主体架构

参考

Decoder-Only、Encoder-Only、Encoder-Decoder 区别_decoder only-CSDN博客,语言大模型知识点简介_prefix decoder-CSDN博客

1. Decoder-Only 架构
描述: 仅包含解码器部分,没有编码器。
应用: 通常用于生成任务,如语言模型和对话系统。
代表模型: GPT(Generative Pre-trained Transformer)
其他: prefix Decoder (输入为之前所有的输出,Y_{t+1}=f([X_0, X_1,..., X_t]))和 causal Decoder(输入为上一时刻的输出,Y_{t+1}=f(X_t))。

2. Encoder-Only 架构
描述: 仅包含编码器部分,没有解码器。
应用: 通常用于理解任务,如文本分类和情感分析。
代表模型: BERT(Bidirectional Encoder Representations from Transformers)

3. Encoder-Decoder 架构
描述: 同时包含编码器和解码器部分。
应用: 通常用于序列到序列(seq2seq)任务,如机器翻译和文本摘要。
代表模型: Transformer、T5
 

http://www.lryc.cn/news/537308.html

相关文章:

  • 理解 WebGPU 的入口: navigator.gpu
  • Django 创建第一个项目
  • ChatGPT vs DeepSeek详细对比
  • 日语学习-日语知识点小记-构建基础-JLPT-N4N5阶段(6):動詞ない形について句型
  • 我的docker随笔46:在x86平台构建龙芯镜像
  • 移动端测试的挑战与解决方案:兼容性、网络问题及实战策略
  • STM32 I2C通信协议说明
  • DeepSeek v3 技术报告阅读笔记
  • HCIA项目实践(网络)---NAT地址转化技术
  • VS studio报错cmake version 3.29.5-msvc4,但是没有其他信息问题解决
  • 免费deepseek的API获取教程及将API接入word或WPS中
  • langchain学习笔记之小样本提示词Few-shot Prompt Template
  • 【CS.SE】优化 Redis 商户号池分配设计:高并发与内存管理
  • 5、《Spring Boot自动配置黑魔法:原理深度剖析》
  • 稀土抑烟剂——为纺织品安全加持,保护您的每一寸触感
  • 如何使用CSS画一个三角形,原理是什么?
  • Docker拉不下来镜像问题解决法案
  • DeepSeek 多模态大模型Janus-Pro本地部署教程
  • 笔记8——模式匹配 match语句(仅在Python 3.10及以上版本中可用)
  • maven-antrun-plugin插件的用法
  • iOS主要知识点梳理回顾-4-运行时类和实例的操作
  • vue2和vue3生命周期的区别通俗易懂
  • 使用 meshgrid函数绘制网格点坐标的原理与代码实现
  • postgresql源码学习(59)—— 磁盘管理器 SMGR
  • Spring Boot(8)深入理解 @Autowired 注解:使用场景与实战示例
  • UE_C++ —— Structs
  • ArcGISPro 新建shp+数据结构
  • DeepSeek教unity------MessagePack-06
  • 2.【BUUCTF】bestphp‘s revenge
  • 《刚刚问世》系列初窥篇-Java+Playwright自动化测试-23- 操作鼠标拖拽 - 番外篇(详细教程)