当前位置: 首页 > news >正文

转置卷积的应用

目录

矩阵转置

一、转置卷积的背景

二、转置卷积的应用

三、转置卷积的区别

卷积


矩阵转置

 

矩阵的转置在信息处理中起到了重要的作用。在计算机科学领域,矩阵常用于表示图像、音频和视频等多媒体数据。当我们需要对这些数据进行处理时,常常需要进行矩阵转置操作。例如,在图像处理中,我们往往需要将图像矩阵进行转置来实现旋转、镜像等效果。在音频处理中,矩阵转置可以用于音频信号的变换和滤波等操作。因此,矩阵的转置在信息处理中具有重要的现实意义
知阵的转置在数据分析中也非常常见。在统计学和机器学习领域,短阵常用于表示样本数据和特征向量。通过对短阵进行转置,我们可以改变数据的排列方式,使得不同的变量或属性可以更好地进行比较和分析。例如,在多元统计分析中,矩阵的转置可以用于求解特征值和特征向量,进而得到数据的主成分和相关性。此外,在数据挖掘和预测分析中,短阵的转置也可以用于特征选择和模型建立等关键步骤。因此,短阵的转置在数据分析中具有重要的现实意义。
矩阵的转置在计算机图形学中也有看广泛的应用。在三维图形的表示和变换中,短阵常用于描述物体的位置、旋转和缩放等变换。通过对矩阵进行转置,我们可以方便地实现不同坐标系之间的转换和变换。例如,在计算机动画中,矩阵的转置可以用于实现物体的运动和变形效果。


一、转置卷积的背景


        通常,对图像进行多次卷积运算后,特征图的尺寸会不断缩小。而对于某些特定任务 (如 图像分割 和 图像生成 等),需将图像恢复到原尺寸再操作。这个将图像由小分辨率映射到大分辨率的尺寸恢复操作,叫做 上采样 (Upsample):
        上采样方法有很多,最近邻插值、线性插值、双线性插值、双三次插值。然而,这些上采样方法都是基于人们的先验经验来设计的,在很多场景中效果并不理想 (如 规则固定、不可学习)。

二、转置卷积的应用


        曾经,转置卷积 又称 反卷积 (Deconvolution)。与传统的上采样方法相比,转置卷积的上采样方式 并非预设的插值方法,而是同标准卷积一样,具有可学习的参数,可通过网络学习来获取最优的上采样方式。

        转置卷积 在某些特定领域具有广泛应用,比如:  

在 DCGAN,生成器将随机值转变为一个全尺寸图片,此时需用到转置卷积。
在语义分割中,会在编码器中用卷积层提取特征,然后在解码器中恢复原先尺寸,从而对原图中的每个像素分类。该过程同样需用转置卷积。经典方法有 FCN 和 U-Net。
CNN 可视化:通过转置卷积将 CNN 的特征图还原到像素空间,以观察特定特征图对哪些模式的图像敏感。


三、转置卷积的区别


        标准卷积的运算操作 其实是对卷积核中的元素 与输入矩阵上对应位置的元素 进行逐像素的乘积并求和。然后,卷积核在输入矩阵上以步长为单位进行滑动,直到遍历完输入矩阵的所有位置。 

        假设,输入是一个 4×4 矩阵,使用 3×3 的标准卷积进行计算,同时令 padding=0,stride=1。最终输出结果应是一个 2×2 矩阵,如图 2 所示:


        在上例中,输入矩阵右上角 3×3 范围的值 (黄色 2 3 4) 会影响 输出矩阵右上角的值 (黄色 27),这其实也对应了标准卷积中感受野的概念。所以,可以说 3×3 标准卷积核 建立了 输入矩阵中 9 个值 到 输出矩阵中 1 个值 的映射关系。    

        综上所述,我们也就可以认为标准卷积操作实际上就是建立了一个 多对一的映射关系。    

        对转置卷积而言,我们实际上是想建立一个逆向操作,即 一对多的映射关系。对于上例,我们想要建立的其实是输出矩阵中的 1 个值与输入矩阵中的 9 个值的关系,如图 3 所示:




         当然,从信息论的角度上看,常规卷积操作是不可逆的,所以转置卷积并不是通过输出矩阵和卷积核计算原始输入矩阵,而是计算得到保持了相对位置关系的矩阵。

 

六、小结 
        注意:矩阵中的实际权值不一定来自原始卷积矩阵。重要的是权重的排布是由卷积矩阵的转置得来的。转置卷积运算与普通卷积形成相同的连通性,但方向是反向的

        我们可以用转置卷积来上采样,而 转置卷积的权值是可学习的,所以无需一个预定义的插值方法。

        尽管它被称为转置卷积,但这并不意味着我们取某个已有的卷积矩阵并使用转置后的版本。重点是,与标准卷积矩阵 (一对多关联而不是多对一关联) 相比,输入和输出之间的关联是以反向的方式处理的

        因此,转置卷积不是卷积,但可以用卷积来模拟转置卷积。通过在输入矩阵的值间插入零值 (以及周围填零) 上采样输入矩阵,然后进行常规卷积 就会产生 与转置卷积相同的效果。你可能会发现一些文章用这种方式解释了转置卷积。但是,由于需要在常规卷积前对输入进行上采样,所以效率较低。 

        注意:转置卷积会导致生成图像中出现 网格/棋盘效应 (checkerboard artifacts),因此后续也存在许多针对该问题的改进工作。

卷积

对于一个输入  的图像,不考虑通道的维度,卷积核的大小为 ,步长为 1,填充为 0。

图片

 

 

http://www.lryc.cn/news/140339.html

相关文章:

  • 常见的移动端布局
  • Typore 亲测有效(懂得都懂哈)
  • Kyligence Copilot 登陆海外,斩获 Product Hunt 日榜 TOP 2
  • 【Docker】Docker 的基本概念和优势,基本命令及使用例子
  • 高并发内存池(回收)[4]
  • 分布式事务篇-2.4 Spring-Boot整合Seata
  • 718. 最长重复子数组
  • Mysql join加多条件与where的区别
  • div滚动条自动滚动到底部
  • 【深度学习】实验02 鸢尾花数据集分析
  • AI大模型潮水中,医疗数字化加速「求解」
  • 【安卓】自定义View实现画板涂鸦等功能
  • 面试题. 搜索旋转数组
  • 前端需要理解的数据治理与异常监控知识
  • ip_vs 原理解析 (四)hook 后的开始 一
  • 【论文解读】基于图的自监督学习联合嵌入预测架构
  • C++ 容器
  • 【PHP】PHP文件操作详解
  • 硬核旗舰南卡OE CC开放式耳机发布,重新定义百元开放式耳机新标杆!
  • 785. 判断二分图
  • 限时 180 天,微软为 RHEL 9 和 Ubuntu 22.04 推出 SQL Server 2022 预览评估版
  • 一款ccm的功率因素校正控制器ncp1654
  • 4.若依框架上传文件
  • Property ‘sqlSessionFactory‘ or ‘sqlSessionTemplate‘ are required
  • idea的debug断点的使用
  • 【UE】蓝图通信——事件分发器
  • Python爬虫分布式架构问题汇总
  • AIGC人工智能涉及三十六职业,看看有没有你的职业(一)
  • 万界星空科技/免费MES系统/免费质量检测系统
  • 解决IndexError: index 0 is out of bounds for axis 1 with size 0