当前位置: 首页 > news >正文

论文学习-Attention Is All You Need

Attention Is All You Need

目前暂时不会用到,大概了解一下即可。

Recurrent model 序列化的计算方式,难以并行,随着序列的增长,以前的记忆会逐渐丢失。而Attention机制可以观察到句子中所有的信息,不受距离影响,而且可以并行计算。

在这里插入图片描述

参考资料:

  • Youtube video:
    李沐老师
    https://www.youtube.com/watch?v=nzqlFIcCSWQ

  • Q,K,V分别的含义:

    这个链接里面有很多讲解,比较详细。https://stats.stackexchange.com/questions/421935/what-exactly-are-keys-queries-and-values-in-attention-mechanisms
    在这里插入图片描述

http://www.lryc.cn/news/248982.html

相关文章:

  • Springboot 使用 RabbitMq 延迟插件 实现订单到期未支付取消订单、设置提醒消息
  • Linux安装Tesseract-OCR(操作系统CentOS)
  • pair和typedef
  • rdf-file:分布式环境下的文件处理
  • Maven下载与安装教程
  • C++(20):通过starts_with/ends_with检查字符串
  • YOLOv8+Nanodet强强联合改进标签分配:使用NanoDet动态标签分配策略,同时集成VFL全新损失,来打造新颖YOLOv8检测器
  • base64字符串转成file
  • NextJS开发:Prisma开启SQL日志输出
  • barcode.js+elementUi——实现二维码的展示——基础积累
  • vue2 el-table 封装
  • harmonyos应用开发者高级认证考试部分答案(2)
  • 【物联网与大数据应用】Hadoop数据处理
  • Kotlin学习——kt里的集合List,Set,Map List集合的各种方法之Int篇
  • docker buildx跨架构构建笔记(x86_64构建下构建aarch64镜像)
  • Sass基础知识详细讲解【附带表图】
  • 《斯坦福数据挖掘教程·第三版》读书笔记(英文版)Chapter 3 Finding Similar Items
  • 天眼销:超有用的企业获客工具
  • dbeaver连接amabri-hbase
  • Mac IDEA解决Maven项目命令行报错:command not found: mvn
  • 线性回归 梯度下降
  • [Linux]进程等待
  • Project DESFT 白皮书中文版——应用于普惠金融的可信数字凭证解决方案
  • 907. 子数组的最小值之和 --力扣 --JAVA
  • 3D模型渲染导致电脑太卡怎么办?
  • 构建个人代理池:使用GitHub项目proxy_pool的搭建配置及代码接口详解
  • Pytorch进阶教学——训练一个图像分类模型(GPU)
  • Docker Swarm总结+CI/CD Devops、gitlab、sonarqube以及harbor的安装集成配置(3/5)
  • Linux:windows 和 Linux 之间文本格式转换
  • VBA技术资料MF88:测试Excel文件名是否有效