当前位置: 首页 > news >正文

【论文阅读】(VAE-GAN)Autoencoding beyond pixels using a learned similarity metric

 论文地址;[1512.09300] Autoencoding beyond pixels using a learned similarity metric (arxiv.org) /

一、Introduction

主要讲了深度学习中生成模型存在的问题,即常用的相似度度量方式(使用元素误差度量)对于学习良好的生成模型存在一定的障碍,并提出了一种新的方法——使用学习到的相似度度量方式来改善生成模型的性能。同时,该部分还介绍了如何学习这种相似度度量方式,即通过联合训练变分自编码器(VAE)和生成对抗网络(GAN)来使用GAN鉴别器来度量样本之间的相似度。

注意:

使用学习相似性度量训练的生成模型与使用元素误差度量训练的模型的区别在于相似性度量的方式不同。使用元素误差度量训练的模型是默认的选择,它使用像平方误差这样的逐元素度量来衡量重建质量。而使用学习相似性度量训练的生成模型则可以使用更高级的、基于特征的度量来衡量重建质量,并且可以在学习中提供更好的数据分布建模。这种方法可以更好地捕捉图像数据的特性,例如对平移等变性的不变性,从而提高生成模型的性能。

二、Autoencoding with learned similarity

本章节主要介绍了如何使用学习到的相似度度量来改进生成模型,特别是在学习像变分自编码器(VAE)这样的模型时,元素级别的相似度度量会成为训练信号的主要组成部分。文章提出了一种基于联合训练VAE和生成对抗网络(GAN)的方法,将GAN鉴别器中学习到的特征表示作为VAE重构目标的基础,从而用特征级别的相似度度量替换元素级别的误差,更好地捕捉数据分布。文章还介绍了如何在人脸图像上应用该方法,并展示了该方法比使用元素级别相似度度量的VAE在视觉保真度方面表现更好的结果。此外,文章还展示了该方法学习到的嵌入空间具有高级别的抽象视觉特征,可以通过简单的算术操作进行修改。

三、Related Work

讨论了之前的相关研究,特别关于使用自编码器进行特征学习和图像重建的研究它提到了一些使用变分自编码器和生成对抗网络方法来提高自编码器重建质量和学习更好的征表示的研究。此外,该部分还介绍了一些特征匹配和相似度度量的方法来比较图像相性的研究。

总结:

本文介绍了一种基于学习相似度度量的自编码器,该自编码器结合了变分自编码器和生成对抗网络的优点,使用GAN鉴别器中学习到的特征表示作为VAE重构目标的基础,从而用特征级别的误差代替元素级别的误差更好地捕捉数据分布。作者在人脸图像数据集上的实验结果表明,与使用元素级别相似度度量的VAE相比,该方法在视觉保真度方面表现更好,同时也展示了该方法学习到了一个内在空间,其中高级别的抽象视觉特征(如戴眼镜)可以通过简单的算术运算进行修改。

http://www.lryc.cn/news/234705.html

相关文章:

  • verilog之wire vs reg区别
  • 力扣面试经典150题详细解析
  • 【Java 进阶篇】唤醒好运:JQuery 抽奖案例详解
  • 数据处理生产环境_利用MurmurHash3算法在Spark和Scala中生成随机颜色
  • 便利工具分享:一个proto文件的便利使用工具
  • LeetCode704.二分查找及二分法
  • 2023年R1快开门式压力容器操作证模拟考试题库及R1快开门式压力容器操作理论考试试题
  • 探索NLP中的核心架构:编码器与解码器的区别
  • 解决:Error: Missing binding xxxxx\node_modules\node-sass\vendor\win32-x64-83\
  • 科研学习|科研软件——面板数据、截面数据、时间序列数据的区别是什么?
  • 【UE5】物体沿样条线移动
  • Qt控件按钮大全
  • 软件工程--软件过程学习笔记
  • 高校教师资格证备考
  • Git通过rebase合并多个commit
  • ROS 学习应用篇(八)ROS中的坐标变换管理之tf广播与监听的编程实现
  • 计算机算法分析与设计(23)---二分搜索算法(C++)
  • 前置语音群呼与语音机器人群呼哪个更好
  • 『Element Plus の 百科大全』
  • P3879 [TJOI2010] 阅读理解- 字典树
  • upgrade k8s (by quqi99)
  • CronExpression
  • 释放机器人潜力,INDEMIND深耕底层技术
  • 【ES6标准入门】JavaScript中的模块Module语法的使用细节:export命令和imprt命令详细使用,超级详细!!!
  • 流量2----2
  • 人工智能发展前景
  • 编写程序,要求输入x的值,输出y的值。分别用(1)不嵌套的if语句(2)嵌套的if语句(3)if-else语句(4)switch语句。
  • AcWing 4520:质数 ← BFS
  • 00、计算机视觉入门与调优简介
  • .L0CK3D来袭:如何保护您的数据免受致命攻击