当前位置: 首页 > news >正文

常见的深度学习模块/操作中的维度约定(系统性总结)

🟩 1. 数据张量(特征图)维度

这是我们喂进网络或从网络中出来的“实际数据”。

类型维度格式举例说明
图像/特征图(B, C, H, W)(4, 3, 32, 32)PyTorch中最常用的数据布局(NCHW)
图像/特征图(TensorFlow风格)(B, H, W, C)(4, 32, 32, 3)TF/Keras默认的数据格式(NHWC)
序列数据(B, T, D)(4, 100, 512)B=batch, T=时间步数, D=特征维度(比如RNN、Transformer输入)


🟨 2. 卷积层的权重张量维度

这些是参数层的权重,不是输入输出数据!

类型维度格式举例含义
1D 卷积(out_channels, in_channels, kernel_size)(64, 32, 3)只沿时间轴卷积
2D 卷积(out_channels, in_channels, kH, kW)(64, 3, 3, 3)最常见
3D 卷积(out_channels, in_channels, D, H, W)(64, 3, 3, 3, 3)用于体积数据/视频等


🟦 3. 全连接层(Linear)维度

类型权重形状举例含义
FC 层权重(out_features, in_features)(5, 192)5个输出神经元,从192维输入接收信号
输入数据(batch_size, in_features)(4, 192)每个样本是1个向量
输出数据(batch_size, out_features)(4, 5)每个样本输出一个向量


🟧 4. 注意力机制中矩阵维度(尤其是 Transformer)

矩阵维度格式举例说明
Query / Key / Value(B, heads, T, d_k)(4, 8, 100, 64)多头注意力中每一头的特征维度
Attention 权重矩阵(B, heads, T_q, T_k)(4, 8, 100, 100)每个query对所有key的注意力分数
Output(B, T, d_model)(4, 100, 512)每个时间步最终的编码结果


🟥 5. RNN / LSTM / GRU 输入输出维度

类型维度举例说明
输入数据(seq_len, batch, input_size)(100, 4, 128)PyTorch默认格式
输出同输入(100, 4, hidden_size)每一步的输出
hidden / cell(num_layers × num_directions, batch, hidden_size)(2, 4, 128)LSTM/GRU的隐藏状态


🟪 6. BatchNorm 层的参数维度

类型参数形状说明
BatchNorm1d(C,)用于线性层或1D卷积输出的每个通道
BatchNorm2d(C,)对应于每个图像通道
BatchNorm3d(C,)视频/体数据的每个通道
http://www.lryc.cn/news/608931.html

相关文章:

  • Docker-03.快速入门-部署MySQL
  • 介绍JAVA语言、介绍greenfoot 工具
  • 北邮:LLM强化学习架构Graph-R1
  • 【机器学习】线性回归算法详解:线性回归、岭回归、Lasso回归与Elastic Net
  • 02.Redis 安装
  • 13.Redis 的级联复制
  • kafka与其他消息队列(如 RabbitMQ, ActiveMQ)相比,有什么优缺点?
  • 《深入浅出RabbitMQ:从零基础到面试通关》
  • RabbitMQ面试精讲 Day 10:消息追踪与幂等性保证
  • 《软件测试与质量控制》实验报告三 系统功能测试
  • Flutter开发 dart异步
  • Spring lookup-method实现原理深度解析
  • [spring-cloud: 服务注册]-源码解析
  • 【Linux】linux基础开发工具(三) 版本控制器Git、调试器 - gdb/cgdb使用、一些实用的调试技巧
  • graph TD的规则
  • zookeeper持久化和恢复原理
  • 大模型智能体(Agent)技术全景:架构演进、协作范式与应用前沿
  • io_destroy系统调用及示例
  • Redis——运维篇
  • Linux | i.MX6ULL移植 Gdb+Gdbserver 调试(第十四章)
  • day50预训练模型 CBAM注意力
  • 蛇形卷积介绍
  • 实战案例:容器数据卷四部曲(三)目录数据卷
  • 【C++】面向对象编程:继承与多态的魅力
  • 对大脑功能连接进行功能注释
  • git配置公钥/密钥
  • FasrCGI
  • 【ROS2】常用命令
  • Python中的import和from...import有什么区别?
  • 北京-4年功能测试2年空窗-报培训班学测开-第六十六天