当前位置: 首页 > news >正文

【nlp】2.8 注意力机制拓展

注意力机制拓展

  • 1 注意力机制原理
    • 1.1 注意力机制示意图
    • 1.2 Attention计算过程
    • 1.3 Attention计算逻辑
    • 1.4 有无attention模型对比
      • 1.4.1 无attention机制的模型
      • 1.4.2 有attention机制的模型

1 注意力机制原理

1.1 注意力机制示意图

Attention机制的工作原理并不复杂,我们可以用下面这张图做一个总结

在这里插入图片描述

1.2 Attention计算过程

  • 阶段一: query 和 key 进行相似度计算,得到一个query 和 key 相关性的分值
  • 阶段二: 将这个分值进行归一化(softmax),得到一个注意力的分布
  • 阶段三: 使用注意力分布和 value 进行计算,得到一个融合注意力的更好的 value 值

为了更好的说明上面的情况, 我们通过注意力来做一个机器

http://www.lryc.cn/news/240136.html

相关文章:

  • mysql 存储引擎ROWS与实际行数不一致
  • 软考小记-软件工程
  • 【开源】基于Vue和SpringBoot的创意工坊双创管理系统
  • COBOL排序问题
  • 数字化转型过程中面临最大的问题是什么?如何借助数字化工具实现快速转型?
  • 视频剪辑有妙招:批量置入封面,轻松提升视频效果
  • Java查询多条数据放入word模板 多个word文件处理成zip压缩包并在前端下载.zip文件
  • PC8223(CC/CV控制)高耐压输入5V/3.4A同步降压电路内建补偿带恒流恒压输出
  • 【webrtc】ModuleRtpRtcpImpl2: RtpRtcp DEPRECATED_Create 废弃了
  • 八股文面试day5
  • 数据处理生产环境_获取当前日期的前一天日期
  • 5.过滤敏感词 + 发布帖子 + 帖子详情
  • 大数据基础设施搭建 - Flume
  • 华为OD机试 - 找朋友(Java 2023 B卷 100分)
  • ESP32 MicroPython 颜色及二维码识别⑫
  • 数据结构与算法编程题15
  • 基于Mapmost Alpha工具快速搭建3D场景可视化大屏
  • OpenAI再次与Sam Altman谈判;ChatGPT Voice正式上线
  • 技术是增长关键驱动!传音控股新专利亮相,看未来手机趋势
  • C# - Opencv应用(2) 之矩阵Mat使用[矩阵创建、图像显示、像素读取与赋值]
  • 执行npm的时候报权限问题的解决方案
  • 【实用】PPT没几页内存很大怎么解决
  • 【Docker】从零开始:8.Docker命令:Commit提交命令
  • 【深度学习】神经网络术语:Epoch、Batch Size和迭代
  • 谈谈你对mvc和mvvm的理解
  • C语言每日一题(35)有效的括号
  • 【DevOps】Git 图文详解(七):标签管理
  • BootStrap【表格二、基础表单、被支持的控件、表单状态】(二)-全面详解(学习总结---从入门到深化)
  • 亿赛通电子文档安全管理系统UploadFileFromClientServiceForClient接口存在任意文件上传漏洞 附POC
  • SPSS系统聚类