当前位置: 首页 > news >正文

图像张量中的通道维度

通道维度”是图像张量中的一个非常重要的维度,它表示图像中有多少种颜色(或特征图),我们来详细解释一下:


✅ 什么是通道维度(channel dimension)?

在深度学习中,图像通常用一个 4维的张量(tensor) 来表示,维度结构如下:

[批量大小, 通道数, 高度, 宽度]batch_size, channels, height, width

举例:灰度图像 vs 彩色图像
  • 灰度图像(黑白图)

    • 通道数 = 1 → [batch_size, 1, height, width]

    • 每个像素只有一个数值,表示灰度(亮度)

  • RGB彩色图像

    • 通道数 = 3 → [batch_size, 3, height, width]

    • 每个像素由 R、G、B 三个值组成


✅ 若张量 X 的形状为

X.shape = [18, 1, 28, 28]

意思是:

  • 有 18 张图像(batch size = 18)

  • 每张图像是 28×28 的 灰度图像

  • 每张图像有 1 个通道(channel)


X.reshape(18, 28, 28) 是干什么的?

它把原本形状为 [18, 1, 28, 28] 的张量 去掉了通道维度 1,变成:

[18, 28, 28]

这是因为:

  • imshow 这个函数用于显示图像时,灰度图只需要 [height, width]

  • PyTorch 加载数据时默认保留通道维度 [1, 28, 28]

  • 为了显示,我们需要手动“压缩”掉通道维度:reshape(18, 28, 28)squeeze(1)


✅ 通道维度的作用(在 CNN 中)

在卷积神经网络中,通道维度非常重要:

  • 输入图像的通道数决定了第一层卷积核的大小

  • 中间每一层卷积通常会增加通道数,表示提取了更多特征

例如:

输入:[1, 28, 28]
第一层卷积后:[16, 28, 28](提取16个特征图)

✅ 总结一句话:

“通道维度”表示图像中颜色或特征的种类。灰度图是1个通道,RGB是3个通道。在可视化灰度图像时,我们通常会把形状 [1, 28, 28] 变成 [28, 28],以便 matplotlib 正确显示。

http://www.lryc.cn/news/609221.html

相关文章:

  • 【C 学习】04.1-数字化基础
  • Spring Boot 整合 Minio 实现高效文件存储解决方案(本地和线上)
  • Monaco Editor 开发流程详解
  • Flutter Dart类的使用
  • Redisson高并发实战:守护Netty IO线程的关键指南
  • 一加Ace5无法连接ColorOS助手解决(安卓设备ADB模式无法连接)
  • 【MySQL】MySQL 中的数据排序是怎么实现的?
  • FreeRTOS源码分析三:列表数据结构
  • 深度学习-读写模型网络文件
  • 03.一键编译安装Redis脚本
  • 07.config 命令实现动态修改配置和慢查询
  • ThinkPHP8.x控制器和模型的使用方法
  • VUE-第二季-01
  • 【实习总结】Qt通过Qt Linguist(语言家)实现多语言支持
  • Python-初学openCV——图像预处理(六)
  • 机器学习之决策树(二)
  • solidworks打开step报【警告!可用的窗口资源极低】的解决方法
  • 《C 语言内存函数深度剖析:从原理到实战(memcpy/memmove/memset/memcmp 全解析)》
  • 使用ACK Serverless容器化部署大语言模型FastChat
  • 【十九、Javaweb-day19-Linux概述】
  • 我的世界模组进阶教程——伤害(1)
  • 每日面试题20:spring和spring boot的区别
  • Linux 文件与目录操作命令宝典
  • Unity_数据持久化_IXmlSerializable接口
  • 【视频内容创作】PR的关键帧动画
  • SQL157 更新记录(一)
  • linux下jvm之jstack的使用
  • 代码随想录day53图论4
  • Java 大视界 -- Java 大数据在智能教育学习资源个性化推荐与学习路径动态调整中的深度应用(378)
  • 【LLM】 BaseModel的作用