当前位置: 首页 > news >正文

AutoEncoder和 Denoising AutoEncoder学习笔记

参考:
【1】 https://lilianweng.github.io/posts/2018-08-12-vae/

写在前面:
只是直觉上的认识,并没有数学推导。后面会写一篇(抄)大一统文章(概率角度理解为什么AE要选择MSE Loss)

TOC

  • 1 AutoEncoder
  • 2 Denoising AutoEncoder

1 AutoEncoder

在这里插入图片描述
AE实际上是一个压缩模型,它通过将输入 x x x传进encoder将图像压缩到隐式特征(latant representation),然后再通过decoder输出 x ′ x' x,试图重建出 x x x。既重建公式为该两个变量的均方差损失:
L = ∣ ∣ x − x ′ ∣ ∣ 2 = 1 N ∑ i = 1 N ( x i − x ′ i ) 2 L=||x-x'||^2=\frac{1}{N}\sum_{i=1}^N(x^i -x'^i)^2 L=∣∣xx2=N1i=1N(xixi)2

如果成功训练好一个AE,那么encoder就可以说能正确提取出输入 x x x的重要特征,而decoder也可以根据这些重要特征还原出与输入 x x x相近的 x ′ x' x

但AE仅仅是在学习等式函数 x = x ′ x=x' x=x,所以很容易就过拟合了(神经网络有强大的拟合函数的能力),过拟合之后那么其仅对训练集数据表现很好,对未知数据的表现就一塌糊涂了。

2 Denoising AutoEncoder

在这里插入图片描述
DAE相当于该模型上了强度,与其给你看完整的东西,不如我遮盖一部分,让你猜这部分是什么,然后将这个东西还原出来(人类视觉方面,如果遮盖了某个东西的一部分,大概率我们还是能想象出来的)

输入到encoder的数据就由 x x x,变为 x ~ i ∼ M D ( x ~ i ∣ x i ) \tilde x^i \sim M_D(\tilde x^i|x^i) x~iMD(x~ixi),其中 x ~ \tilde x x~表示被破坏的,或者被噪声污染过后的 x x x M D M_D MD表示噪声的随即映射分布,或者被随机破坏(置0)的每个像素上的概率。总之就是这么一回事。

我们可以理解为,当一部分像素被破坏之后,对于图像这种高维输入且高度冗余的数据,模型就要根据其他的维度去预测损失的维度的数据,就不再是去过拟合一个维度,这就构建了一个很好的学习到鲁棒隐式特征的基础。
【一个不恰当的例子:比如看到1、2、3,AE就记住了1、2、3的特征,那么给数据1、3、4,那么它可能就还原不出4。但是看到1、2、_,GT为1、2、3,那么模型可能就会根据1、2去推理出3(比如1+2=3),那么给出数据1、3、4,对于4,模型也有能力根据1、3去推出,学习到了某些加法操作的特征】

http://www.lryc.cn/news/310880.html

相关文章:

  • 计算机系统基础
  • live555学习 - 环境准备
  • C++ 模拟OJ
  • MariaDB MaxScale实现mysql8读写分离
  • 代码随想录day11(1)字符串:反转字符串中的单词 (leetcode151)
  • PlantUML - 时序图
  • VS Code 的粘性滚动预览 - 类似于 Excel 的冻结首行
  • Java中的List
  • Spring 框架模块深度解析:核心容器、数据访问、Web 层与其他关键模块
  • 前端配置开发环境,新电脑配置前端开发环境,Vue开发环境配置的详细过程(前端开发环境配置,电脑重置后配置前端开发环境)
  • 大模型(LLM)的量化技术Quantization原理学习
  • 2024.03.01作业
  • 力扣hot100:42.接雨水
  • 搜索回溯算法(DFS)1------递归
  • workstation 用途
  • 【三维重建】【SLAM】SplaTAM:基于3D高斯的密集RGB-D SLAM(CVPR 2024)
  • Go Barrier栅栏
  • [蓝桥杯 2023 省 B] 冶炼金属
  • 续Java的执行语句、方法--学习JavaEE的day07
  • 公网IP怎么获取?
  • 连接未来:探索嵌入式系统的智能化之路
  • 基于STM32制作的示波器(可对任意信号进行描点)
  • WEB APIs (5)
  • 物联网常见协议篇
  • Kubernetes-1
  • SpringMVC框架②
  • springboot230基于Spring Boot在线远程考试系统的设计与实现
  • 盘点:国家智能算力中心
  • 【C++】7-2 寻找完美数 分数 10
  • 基于Mahout实现K-Means聚类