当前位置: 首页 > news >正文

【深度学习】NestedTensors

文章目录

  • NestedTensors
  • Why NestedTensor
  • 初始化 NestedTensor
  • NestedTensor 操作
    • reshape
    • 转置
    • 查看维度
    • 其他

NestedTensors

DETR 中常见的数据格式为 NestedTensors,那么什么是 NestedTensors 呢?
NestedTensor,包括 tensormask 两个成员,tensor 就是输入的图像。mask 跟 tensor 同高宽但是单通道。比如 masks 大小为 (1, 800, 1440),tensor 大小为 (1, 3, 800, 1440)。

Why NestedTensor

当数据是连续的时,通常情况下每个样本都有不同的长度。
例如,在一批句子中,每个句子都有不同数量的单词。处理变化序列的一种常见技术是手动将每个数据张量填充到相同的形状,以形成一个批。
例如,我们有两个不同长度的句子和一个词汇表。为了将其表示为单个张量,我们将 0 填充到批中的最大长度。
简单说就是把图片都 padding 成最大的尺寸,padding 的方式就是补零,那么 batch 中的每一张图都有一个 mask 矩阵,在 img 有值的地方是 1,补零的地方是 0。

举个例子,下面两种构造方式其实是等价的,

padded_sentences = torch.tensor([[1.0, 2.0, 0.0],[3.0, 4.0, 5.0]])
nested_sentences = torch.nested.nested_tensor([torch.tensor([1.0, 2.0]),torch.tensor([3.0, 4.0, 5.0])])

初始化 NestedTensor

我们可以从张量列表中创建 nestedtensor。我们将 nt[i] 表示为nestedtensor的第 i 个张量分量。

nt = torch.nested.nested_tensor([torch.arange(12).reshape(2, 6), torch.arange(18).reshape(3, 6)], dtype=torch.float, device=device)

NestedTensor 操作

reshape

nt_reshaped = nt.reshape(2, -1, 2, 3)

转置

nt_transposed = nt_reshaped.transpose(1, 2)

查看维度

假设 features 为 NestedTensor 格式,直接运行 features[-1]. shape 则会报错 AttributeError: ‘NestedTensor’ object has no attribute ‘Nested_Tensor’,应该使用 features[-1]. tensors. shape

其他

其他操作具有与常规张量相同的语法。

nt_mm = torch.nested.nested_tensor([torch.randn((2, 3, 4)), torch.randn((2, 3, 5))], device=device)
nt3 = torch.matmul(nt_transposed, nt_mm)
print(f"Result of Matmul:\n {nt3}")nt4 = F.dropout(nt3, 0.1)
print(f"Result of Dropout:\n {nt4}")nt5 = F.softmax(nt4, -1)
print(f"Result of Softmax:\n {nt5}")
http://www.lryc.cn/news/322290.html

相关文章:

  • 【网络】负载均衡
  • dataGridView 绑定List 显示内容不刷新
  • VR历史建筑漫游介绍|虚拟现实体验店|VR设备购买
  • Linux查看硬件型号详细信息
  • 【鸿蒙HarmonyOS开发笔记】通知模块之发布基础类型通知,内含如何将图片变成PixelMap对象
  • 外包干了1个月,技术明显进步。。。
  • 鸿蒙开发实战:【Faultloggerd部件】
  • 蓝桥杯刷题|03普及-真题
  • 【动态三维重建】Deformable 3D Gaussians 可变形3D GS用于单目动态场景重建(CVPR 2024)
  • 智能驾驶域控制器行业介绍
  • [数据集][目标检测]焊接件表面缺陷检测数据集VOC+YOLO格式2292张10类别
  • 微信小程序的页面制作---常用组件及其属性
  • 什么样的网站不适合使用WordPress?
  • vulhub中GitLab 任意文件读取漏洞复现(CVE-2016-9086)
  • 【爬虫】web自动化和接口自动化
  • 哔哩哔哩后端Java一面
  • Vue.js前端开发零基础教学(二)
  • Bert模型输出:last_hidden_state转换为pooler_output
  • Docker Compose 基本语法
  • 【算法集训】基础算法:贪心
  • Centos7部署单节点MongoDB(V4.2.25)
  • 隐私计算笔记(1)
  • 查询方法需要使用事务吗?
  • 剑指offer面试题40 数组中只出现一次的数字
  • gitLab server version 13.12.1 is not supported
  • 如何在 iPhone 上使用蓝牙鼠标
  • matlab simulink 电力系统同步发电机励磁系统的建模与仿真
  • AI新工具(20240320) AI创作一首属于自己的音乐; 轻松制作具有透明背景的高质量图像
  • IT服务ITIL4 认证:助力企业数字化转型的必杀技!
  • 微软聘请了谷歌DeepMind的联合创始人