当前位置: 首页 > news >正文

Attention机制 学习笔记

学习自https://easyai.tech/ai-definition/attention/

Attention本质

Attention(注意力)机制如果浅层的理解,跟他的名字非常匹配。他的核心逻辑就是“从关注全部到关注重点”。

比如我们人在看图片时,对图片的不同地方的注意力是不同的。

即,我们的视觉系统就是一种 Attention机制,将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。

Attention与NLP的联系
在这里插入图片描述

Attention的优点

  • 参数少,与CNN,RNN相比,参数少,复杂度更低

  • 速度快,Attention机制每一步计算不依赖于上一步的计算结果,因此可以和CNN一样并行处理。

  • 在 Attention 机制引入之前,有一个问题大家一直很苦恼:长距离的信息会被弱化,就好像记忆能力弱的人,记不住过去的事情是一样的。

    Attention 是挑重点,就算文本比较长,也能从中间抓住重点,不丢失重要的信息。下图红色的预期就是被挑出来的重点。
    在这里插入图片描述

Attention原理

一个小小的例子,比如我想要更多的了解漫威,那么我就应该多读一读相关的书籍,与之关系不大的书就不用大量地看。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-46K93WJa-1676108183205)(./marvel.png)]

稍微具体化一点就是:图书管(source)里有很多书(value),为了方便查找,我们给书做了编号(key)。当我们想要了解漫威(query)的时候,我们就可以看看那些动漫、电影、甚至二战(美国队长)相关的书籍。不过为了提升效率,动漫、电影的书籍需要多看一下,而二战类的书籍就不需要看那么多了。

Attention具体流程

  • query 和 key 进行相似度计算,得到权值
  • 将权值进行归一化,得到直接可用的权重
  • 将权重和 value 进行加权求和

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WeNYtAUN-1676108183205)(./attention.png)]

http://www.lryc.cn/news/2609.html

相关文章:

  • 数据类型与运算符
  • 算法刷题-二叉树的锯齿形层序遍历、用栈实现队列 栈设计、买卖股票的最佳时机 IV
  • 华为OD机试 - 最小传递延迟(Python)| 代码编写思路+核心知识点
  • 集中供热调度系统天然气仪表内网仪表图像识别案例
  • 笔试题-2023-复旦微-数字IC设计【纯净题目版】
  • 【Linux】冯诺依曼体系结构和操作系统概念
  • HTML5之HTML基础学习笔记
  • FreeRTOS信号量 | FreeRTOS十
  • 【SpringBoot】SpringBoot常用注解
  • 数据一致性
  • Docker不做虚拟化内核,对.NET有什么影响?
  • HTML总结
  • ByteHouse:基于ClickHouse的实时数仓能力升级解读
  • [SSD固态硬盘技术 15] FTL映射表的神秘面纱
  • 浅析依赖注入框架的生命周期(以 InversifyJS 为例)
  • HER2靶向药物研发进展-销售数据-上市药品前景分析
  • 【第38天】不同路径数问题 | 网格 dp 入门
  • LINUX之链接命令
  • 1628_MIT 6.828 xv6_chapter0操作系统接口
  • 使用 Sahi 实现 Web 自动化测试
  • 天津菲图尼克科技携洁净及无菌防护服解决方案与您相约2023生物发酵展
  • Java 网络编程详解
  • Scratch少儿编程案例-几何形式贪吃蛇
  • 一定要收藏的面试思维导图,粉丝分享面试经验
  • 【博客615】通过systemd设置cgroup来限制服务资源争抢
  • C语言经典编程题100例(21-40)
  • Rabbitmq业务难点
  • 服务器如何下载百度网盘文件?Linux服务器如何在百度网盘中连接、上传下载;在Linux服务器上下载百度云盘中的资料
  • Cesium-数字仿真-你总要了解
  • 原型、原型链、__proto__与prototype的区别、继承