当前位置: 首页 > news >正文

transformer and DETR

RNN
很难并行化处理

Transformer
1、Input向量x1-x4分别乘上矩阵W得到embedding向量a1-a4。
2、向量a1-a4分别乘上Wq、Wk、Wv得到不同的qi、ki、vi(i={1,2,3,4})。
3、使用q1对每个k(ki)做attention得到a1,i(i={1,2,3,4}),q1、k1,q1、k2,…,还要做一个归一化操作。
4、把计算的a1,i做softmax操作,得到~a1,i,然后把它a1,i和所有的vi值相乘,然后相加得到b1,依次计算后得到bi。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Multi-head self-attention
在self-attention的第二步,分别乘以多个wq、wk、wv矩阵得到qi,j、ki,j、vi,j。

位置编码
position emb

DETR
在这里插入图片描述
1、用CNN去提取特征
2、用transformer-encoder做编码提取全局泽正
3、用transformer-decoder生成预测框子
4、用框子和GT做二分图的loss

http://www.lryc.cn/news/65219.html

相关文章:

  • 数据结构(六)—— 二叉树(4)回溯
  • JVM基础知识(一)
  • ASP.NET Core Web API用户身份验证
  • 785. 快速排序
  • C6678学习-IPC
  • 利用 Delte-Sigma ADC简化电路设计
  • 如何在 Windows 11 启用 Hyper-V
  • 哈希表企业应用-DNA的字符串检测
  • Kafka运维与监控
  • 【Redis—哨兵机制】
  • MySQL学习笔记第七天
  • 中级软件设计师备考---程序设计语言和法律法规知识
  • Leetcode434. 字符串中的单词数
  • C++ cmake工程引入qt6和Quick 教程
  • JavaEE - 网络编程
  • 【Android车载系列】第11章 系统服务-SystemServer自定义服务
  • Lerna
  • 迁移学习 pytorch
  • 【python】keras包:深度学习( RNN循环神经网络 Recurrent Neural Networks)
  • vue框架快速入门
  • Java连接顺丰开放平台
  • 前端三剑客 - HTML
  • 【计算机视觉 | 自然语言处理】BLIP:统一视觉—语言理解和生成任务(论文讲解)
  • c++基础-运算符
  • 美术馆c++
  • 浅谈MySQL索引以及执行计划
  • 在c++项目中使用rapidjson(有具体的步骤,十分详细) windows10系统
  • 编译方式汇总:Makefile\configure\autogen.sh\configure.ac、Makefile.am文件
  • explicit关键字
  • [优雅的面试] 你了解python的对象吗