当前位置: 首页 > news >正文

昇思25天学习打卡营第XX天|CycleGAN图像风格迁移互换

CycleGAN是一种用于图像到图像翻译的生成对抗网络,它突破了传统域迁移模型的限制,无需成对样本即可学习图像在不同域间的转换。这种无监督的方法特别适用于难以获取配对数据的场景,例如艺术风格迁移。与需要成对训练样本的Pix2Pix不同,CycleGAN通过循环一致性损失和对抗性训练,实现了两个域之间自由的图像风格转换,极大地扩展了图像处理的应用范围和灵活性。

这几个带读论文真不错,解析很精炼入门,可惜都是17年的。

模型结构

CycleGAN 网络本质上是由两个镜像对称的 GAN 网络组成,其结构如下图所示(图片来源于原论文):

CycleGAN

为了方便理解,这里以苹果和橘子为例介绍。上图中 X 可以理解为苹果,Y 为橘子;G 为将苹果生成橘子风格的生成器,F 为将橘子生成的苹果风格的生成器,DX 和 DY 为其相应判别器,具体生成器和判别器的结构可见下文代码。模型最终能够输出两个模型的权重,分别将两种图像的风格进行彼此迁移,生成新的图像。

该模型一个很重要的部分就是损失函数,在所有损失里面循环一致损失(Cycle Consistency Loss)是最重要的。循环损失的计算过程如下图所示(图片来源于原论文):

Cycle Consistency Loss

图中苹果图片 x 经过生成器 G 得到伪橘子 Y^,然后将伪橘子 Y^ 结果送进生成器 F 又产生苹果风格的结果 x^,最后将生成的苹果风格结果x^ 与原苹果图片x 一起计算出循环一致损失,反之亦然。循环损失捕捉了这样的直觉,即如果我们从一个域转换到另一个域,然后再转换回来,我们应该到达我们开始的地方。

http://www.lryc.cn/news/411596.html

相关文章:

  • 嵌入式Linux学习: interrupt实验
  • GPT-4o mini 来袭:开发者如何驾驭新一代AI模型?
  • 校园点餐系统
  • 进口不锈钢309S螺栓的应用优势
  • C# 设计模式之工厂方法模式
  • Webpack 从入门到精通
  • 基于VScode和C++ 实现Protobuf数据格式的通信
  • linux环境openssl升级
  • 150Kg载重遥控履带式无人车技术详解
  • STM32的外部中断详解
  • 关于python问题 ,生成的excel文件内无爬取的数据存在,请问应如何解决?
  • 详细介绍Avalonia中的文件操作StorageProvider服务
  • 「7.31更新日志」JVS·智能BI、逻辑、规则引擎功能更新说明
  • 编程语言 | C | 代码整理 | 4月
  • 模板可变参数
  • 是你!是你!我们的黄金写手!
  • QT 获取用于获取特定屏幕坐标处的最上层小部件(父与子关系的类)
  • 【应急响应】Linux权限维持 -隐藏权限
  • 还有哪些AI应用案例目前备受关注
  • 将控制台内容输出到文本文件
  • 380. O(1) 时间插入、删除和获取随机元素【 力扣(LeetCode) 】
  • 【每日刷题】Day91
  • 数据库索引的创建和使用
  • 光流传感器 - 从零开始认识各种传感器【第二十二期】
  • 爬虫:jsonpath模块及腾讯招聘数据获取
  • 透明屏幕的显示原理与特点
  • [Day 41] 區塊鏈與人工智能的聯動應用:理論、技術與實踐
  • PHP表单验证
  • 英文文献翻译软件有哪些?知道这5款工具就够了
  • 单线程 和多线程区别,看打印输出1000个数字效果