当前位置: 首页 > news >正文

笔记:transformer系列

1、和其他网络的比较 

 自注意力机制适合处理长文本,并行度好,在GPU上,CNN和Self-attention性能差不多,在TPU(Tensor Processing Uni)效果更好。

总结:

  • 自注意力池化层将x_{i}当做key,value,query来对序列抽取特征。
  • 完全并行,最长序列为1,但对长序列计算复杂度高
  • 位置编码在输入中加入位置信息,使得自注意力能够学习位置信息。

2、输入特点

原生的Transformer中nn.embeding输入需要非负整数,且范围在[0,100]之间(试出来的,未必准确),这是对不同长度的单词维度进行扩展,但是对于图像或者其他类别而言未必是最后一个维度大小不一致,可以参考ViT将nn.embeding换成nn.Linear,还需要修改mask.

3、网络介绍

ViT

DETR基本思想:

        1、先用CNN得到各个Patch作为输入,在套用transformer做编码和解码

        2、编码和VIT一样,重点在解码,直接预测100个坐标框。

整体网络架构:

        object quries是核心:让它学会怎么从原始特征找到物体的位置。

        Encoder完成的任务:得到各个目标注意力结果,准备好特征。

Trac

http://www.lryc.cn/news/138803.html

相关文章:

  • Mysql socket连接测试
  • 探究分布式操作系统的本质
  • opencv-dnn
  • 如何选择合适的开源许可证?
  • 【前端】深入解析CSS:选择器、显示模式、背景属性和特征剖析
  • 算法训练营第三十四天(8.23)| 动态规划Part04:01背包
  • 【python】tkinter使用多进程打包成exe后multiprocessing无法关闭对应进程
  • Redis工具类(缓存操作,Object转换成JSON数据)
  • Linux 下 Java Socket 编程报 java.net.Exception:Permission denied (权限不足)
  • IDEA项目实践——VUE介绍与案例分析
  • vue-canvas基本使用和注意事项-动画闪烁效果-自适应适配不同分辨率问题
  • Jmeter 如何才能做好接口测试?
  • 电商平台京东平台获得京东商品描述API接口演示案例
  • 《算法竞赛·快冲300题》每日一题:“单位转换”
  • R语言13-R语言中的数据导入导出和批量导入
  • 【Java】对象与类
  • 视频尺寸缩小,一键批量剪辑,轻松制作精简版
  • leetcode做题笔记94. 二叉树的中序遍历
  • UWB高精度人员定位系统源码,微服务+java+ spring boot+ vue+ mysql技术开发
  • 企业党建杂志企业党建杂志社企业党建编辑部2023年第4期目录
  • ChatGPT + Flutter快速开发多端聊天机器人App
  • ubuntu18.04复现yolo v8之最终章,realsenseD435i+yolo v8完美运行
  • Python统计中文词频的四种方法
  • sql server 快速安装
  • 机器学习之损失函数
  • nacos适配SqlServer、Oracle
  • 力扣:74. 搜索二维矩阵(Python3)
  • CPU、MCU、MPU、SOC、SOCPC、概念解释之在嵌入式领域常听到的名词含义
  • 每日两题 111二叉树的最小深度 112路径总和(递归)
  • 实训笔记8.24