当前位置: 首页 > article >正文

大语言模型(LLM)入门 - (1) 相关概念

文章来自:大语言模型(LLM)小白入门自学项目-TiaoYu-1

GitHub - tiaoyu1122/TiaoYu-1: For People! For Freedom!For People! For Freedom! Contribute to tiaoyu1122/TiaoYu-1 development by creating an account on GitHub.https://github.com/tiaoyu1122/TiaoYu-1

项目优点:

  1. 行行代码都有“中文注释”,方便阅读与理解。
  2. 覆盖了 全部训练流程,包括:预训练、有监督微调(SFT)、人类反馈强化学习(ELHF)、LoRA微调、推理模型训练(Reasoning)、知识蒸馏(KD)等。
  3. 配套有原理文档

阅读顺序推荐:

相关概念(文档) -> 模型构建(文档) -> (粗读)模型超参数(代码) -> (可选)预训练数据下载(代码) -> (可选)预训练数据处理(代码) -> 分词器(文档) -> 分词器(代码) -> (可选)分词器模型(json文件) -> LLM模型整体结构(代码) -> 模型超参数(代码)-> 嵌入层(文档) -> 正则化(文档) -> 位置编码(文档) -> 位置编码(代码) -> 归一化(文档) -> 归一化(代码) -> 线性层(文档)-> 激活函数(文档) -> 解码器(文档) -> 解码器(代码) 多头掩码自注意力机制(文档) -> 多头掩码自注意力机制(代码) ->Flash Attention(文档) -> MOE前馈神经网络(文档) -> MOE前馈神经网络(代码) -> 输出结果类(代码) -> 预训练数据加载(代码) -> 交叉熵损失函数(文档) -> 信息量、熵、交叉熵、KL散度等(文档) -> 优化器(文档) -> (复习)模型构建(文档) -> 预训练(代码) -> SFT(代码) -> 人类反馈强化学习(文档) -> 人类反馈强化学习(代码) -> LoRA微调(代码) -> 知识蒸馏(代码) -> 推理模型训练(代码) (可选)分类模型评价指标(文档) -> (可选)梯度消失与梯度爆炸(文档) -> (可选)非极大抑制算法(文档)-> (可选)GPT和BERT(文档) -> (可选)Q-Former(文档)


http://www.lryc.cn/news/2395078.html

相关文章:

  • 行为型:访问者模式
  • C++数据结构 : 哈希表的实现
  • 抖音电商客户端一面面经
  • JavaScript 在 AcroForm 中的广泛应用
  • Socket编程之TCP套件字
  • AD9268、AD9643调试过程中遇到的问题
  • Java-File类基本方法使用指南
  • Python爬虫实战:研究PyQuery库相关技术
  • 第九篇:MySQL 安全加固与访问控制策略实战
  • 神经网络-Day40
  • WindowServer2022下docker方式安装dify步骤
  • Java五种方法批量处理List元素全解
  • springboot文件上传下载
  • webpack CDN打包优化
  • ARM内核一览
  • Rust 和 Python 如何混合使用
  • 台式电脑CPU天梯图_2025年台式电脑CPU天梯图
  • 2025年渗透测试面试题总结-匿名[校招]安全服务工程师(题目+回答)
  • Deseq2:MAG相对丰度差异检验
  • CTFHub-RCE 命令注入-过滤目录分隔符
  • 从零开始的数据结构教程(七) 回溯算法
  • CentOS-stream-9 Zabbix的安装与配置
  • 开源是什么?我们为什么要开源?
  • 【unity游戏开发——编辑器扩展】EditorApplication公共类处理编辑器生命周期事件、播放模式控制以及各种编辑器状态查询
  • elasticsearch低频字段优化
  • React---day3
  • PyCharm接入DeepSeek,实现高效AI编程
  • 前端面经 get和post区别
  • CTFSHOW-WEB-36D杯
  • MySQL connection close 后, mysql server上的行为是什么