当前位置: 首页 > news >正文

LLM 架构

LLM 分类 :

  • 自编码模型 (encoder) : 代表模型 : BERT
  • 自回归模型 (decoder) : 代表模型 : GPT
  • 序列到序列模型 (encoder-decoder) : 代表模型 : T5

自编码模型 (AutoEncoder model , AE)

  • 代表模型 : BERT (Bidirectional Encoder Representation from Transformers)
  • 特点 : Encoder-Only
  • 基本原理 : 在输入中随机 MASK 掉一部分单词,根据上下文预测这个词
  • 应用场景 : 内容理解任务,如 : 自然语言理解 (NLU )中的分类任务 (情感分析、提取式问答等 )

自回归模型 (Autoregressive model , AR)

  • 代表模型 : GPT
  • 特点 : Decoder-Only
  • 基本原理 : 从左往右学习的模型,只能利用上文或 下文的信息
  • 应用场景 : 生成式任务,如 : 自然语言生成 (NLG )领域的任务 (摘要、翻译、抽象问答等 )

序列到序列模型 (Sequence to Sequence Model)

  • 代表模型 : T5
  • 特点 : 同时使用编码器和解码器
  • 基本原理 : 将每个 task 视作序列到序列的转换/ 生成
  • 应用场景 : 需要内容理解和生成的任务,如 : 机器翻译

发展图 :

http://www.lryc.cn/news/538955.html

相关文章:

  • Word Embeddings
  • 相机开发调中广角和焦距有什么不一样
  • krpano学习笔记,端口修改,krpano二次开发文档,krpano三维div信息展示,krpano热点显示文字
  • Jenkins 给任务分配 节点(Node)、设置工作空间目录
  • 深入解析iOS视频录制(二):自定义UI的实现
  • 跳表的C语言实现
  • Java Web开发实战与项目——Spring Security与权限管理实现
  • 单元测试方法的使用
  • VScode内接入deepseek包过程(本地部署版包会)
  • flink写入hdfs数据如何保证幂等的?
  • newgrp docker需要每次刷新问题
  • LM_Funny-2-01 递推算法:从数学基础到跨学科应用
  • WDM_OTN_基础知识_波分站点与组网类型
  • 机器视觉--索贝尔滤波
  • 网络分析仪E5071C的回波损耗测量
  • 力扣-二叉树-98 验证二叉搜索树
  • 【动态规划】详解 0-1背包问题
  • 【Java线程池与线程状态】线程池分类与最佳实践
  • 【小白学AI系列】NLP 核心知识点(八)多头自注意力机制
  • 学习笔记——word中图目录、表目录 标题引用
  • 3.3 Hugging Face Transformers核心功能模块深度解析
  • linux中设置脚本定时执行ntp命令同步时间
  • map的使用(c++)
  • 毕业设计—基于Spring Boot的社区居民健康管理平台的设计与实现
  • Python:蟒蛇绘制(一笔画)
  • mysql查询判断函数,类似decode
  • 异常处理、事务管理
  • UART(一)——UART基础
  • MySQL 中各种日志简介
  • 【每日论文】Text-guided Sparse Voxel Pruning for Efficient 3D Visual Grounding