当前位置: 首页 > news >正文

Transformer

Transformer由4部分组成,分别是:

输入模块、编码模块、解码模块、输出模块

整体架构图:

一、输入模块结构 (1)源文本嵌入层及其位置编码器

(2)目标文本嵌入层及其位置编码器

二、编码器模块结构

  • 由N个编码器层堆叠而成

  • 每个编码器层由两个子层连接结构组成

  • 第一个子层连接结构包括一个多头自注意力子层、规范化层和一个残差连接

  • 第二个子层连接结构包括一个前馈全连接子层、规范化层和一个残差连接

三、解码器模块

  • 由N个解码器层堆叠而成

  • 每个解码器层由三个子层连接结构组成

  • 第一个子层连接结构包括一个多头自注意力子层、规范化层和一个残差连接

  • 第二个子层连接结构包括一个多头注意力子层、规范化层和一个残差连接

  • 第三个子层连接结构包括一个前馈全连接子层、规范化层和一个残差连接

四、输出模块结构:

  • 线性层

  • softmax层

http://www.lryc.cn/news/5494.html

相关文章:

  • 并发包工具之 批量处理任务 CompletionService(异步)、CompletableFuture(回调)
  • 验收测试分类
  • 因新硬件支持内核问题Ubuntu 22.04.2推迟发布
  • agent扩展-自定义外部加载路径
  • Elasticsearch使用篇 - 指标聚合
  • Python生命周期及内存管理
  • Elasticsearch7.8.0版本进阶——数据写流程
  • 化学试剂Glutaric Acid-PEG-Glutaric Acid,GA-PEG-GA,戊二酸-聚乙二醇-戊二酸
  • 知识图谱业务落地技术推荐之国内知识图谱平台汇总(竞品)[阿里、腾讯、华为等】
  • ABC 289 G - Shopping in AtCoder store 数学推导+凸包
  • ARM Linux 如何在sysfs用户态命令行中控制 GPIO 引脚?
  • 【Linux】生产者消费者模型 - 详解
  • 源码深度解析Spring Bean的加载
  • STL——priority_queue
  • Springboot集成工作流Activity
  • 2023软件测试工程师涨薪攻略,3年如何达到月薪30K?
  • Java面试——Spring Bean相关知识
  • 上班在群里摸鱼,逮到一个字节8年测试开发,聊过之后羞愧难当...
  • HTTP、WebSocket和Socket.IO
  • Fluent Python 笔记 第 11 章 接口:从协议到抽象基类
  • 【Spark分布式内存计算框架——Spark Core】11. Spark 内核调度(下)
  • Java中的函数
  • 实验6-霍纳法则及变治技术
  • IP地址:揭晓安欣警官自证清白的黑科技
  • 考研复试机试 | C++
  • 第四章.误差反向传播法—误差反向传播法实现手写数字识别神经网络
  • IB学习者的培养目标有哪些?
  • C++类基础(十三)
  • 03 OpenCV图像运算
  • 【C语言学习笔记】:动态库