当前位置: 首页 > news >正文

卷积和转置卷积的输出尺寸计算

卷积和转置卷积的输出尺寸计算

卷积

h'是输出的高,h是输入的高,k_h是卷积核的高
w类似

stride=1

h' = h - k_h + padding*2 + 1

通用公式

stride=1就是上面的公式

 h' = (h - k_w + 2*padding + stride)//stride 

一些常见的卷积

  • 高宽不变的卷积kernel_size=3, padding=1,这样的卷积常用于特征提取加深网络层数避免信息丢失,以及在深层网络(如 ResNet)中保持输入输出尺寸一致。
  • 宽高减半的卷积:如kernel_size=3, stride=2, padding=1,一般是将stride=2,若kernel_size=5的话,padding就要为2了。(也可以用kernel_size=2,stride=2的池化来做。两者各有优点:卷积核是可学习的参数,可以提取复杂的特征,但计算量比池化更大;池化没有可学习的参数,计算效率高,同时有一定的平滑特征图的作用,但会丢失一些细节信息)。
  • 1×1的卷积:1×1 卷积改变特征图的通道数,而不改变空间维度(即图像的高和宽)。通常用于降维从而减少计算复杂度,或者升维进行更丰富的特征表示。1×1也可以认为是逐像素的全连接层(其对每个像素位置上不同通道的特征进行加权线性组合。这与全连接层的机制非常相似,都是对输入的所有特征进行线性组合)。

转置卷积

计算公式,其实就是上面公式的逆运算

h' = h*stride - 2*padding + k_w - stride

若想要将图像高宽扩大p倍,就可以让stride=p,然后调整k_w和padding,比如,input image shape: torch.Size([561, 728, 3]) 变为 output image shape: torch.Size([1122, 1456, 3]),先让stride=2,然后kernel_size=4(这样滑动一次只滑过窗口的一半),然后看padding取多少,可以让 -2*padding + k_w - stride = 0,这里padding就取1。

再比如,高宽被缩小32倍后为 torch.Size([1, 512, 10, 15]) ,想要恢复原尺寸:首先stride = 32kernel_size还是取stride的两倍64,然后让 -2*padding + k_w -stride=0,那么padding就取16

http://www.lryc.cn/news/441547.html

相关文章:

  • vue3+ts 使用amCharts展示地图,1.点击左侧国家,可以高亮并放大右侧地图对应的国家。 2.展示数据球。
  • 汽车无钥匙启动功能工作原理
  • C++标准的一些特性记录:C++11的auto和decltype
  • 【Elasticsearch系列四】ELK Stack
  • 【新手上路】衡石分析平台使用手册-认证方式
  • 数字电路与逻辑设计-触发器功能测试及其应用
  • 【网站架构部署与优化】web服务与http协议
  • 【字符函数】strcpy函数(字符串复制函数)+strcat函数(字符串追加)+strcmp函数(字符串比较)【笔记】
  • codetop字符串刷题,刷穿地心!!不再畏惧!!暴打面试官!!
  • 快速体验Linux发行版:DistroSea详解与操作指南
  • Java设计模式—面向对象设计原则(二) --------> 里氏代换原则 LSP (完整详解,附有代码+案列)
  • 使用ShardingSphere实现MySql的分库分表
  • 为什么 Feign 要用 HTTP 而不是 RPC?
  • OJ在线评测系统 前端开发设计优化通用菜单组件二 调试用户自动登录
  • mongodb 安装教程
  • 切换淘宝最新镜像源npm
  • SpringAI-基于java大模型的胡言乱语
  • python提问及解析
  • 从Apple Intelligence到IoT Intelligence,端侧生成式AI时代加速到来
  • 智能AC管理系统HTTPD-AC 1.0服务存在未授权访问漏洞
  • Sidewalk介绍
  • Java数据结构 (泛型第二节) 泛型擦除机制/泛型的限制/上界下界
  • 数据安全标准在非结构化数据中台的遵守
  • 探索Go语言中的Goroutine并发机制
  • 实现实时Web应用,使用AJAX轮询、WebSocket、还是SSE呢??
  • 3GPP协议入门——物理层基础(一)
  • 关于Java数据结构中集合的一个小知识
  • leetcode41. 缺失的第一个正数,原地哈希表
  • 如何准备教师资格证科目三“学科知识与教学能力”的考试与面试?(理科导向:数学/物理)
  • 3.数据类型