当前位置: 首页 > news >正文

【计算机视觉】FusionGAN

1. FusionGAN论文阅读

abreheret/FusionGAN: Pytorch implementation of "Generating a Fusion Image: One’s Identity and Another’s Shape"

1.1. WHY

在现实世界中,将对象或人物转换为期望的形状是一种常用技术,但现有的图像翻译方法在处理身份和形状时存在不足,如现有图像翻译学习映射函数时缺乏明确的形状匹配损失函数,可能导致形状无法保持。因此需要新的框架来有效处理身份和形状问题,以生成融合图像,例如将一个人的身份与另一个人的姿势相结合,将合成眼图像转换为真实图像并保持形状,或实现不同风格图像(如照片、素描、卡通)之间的转换等。

1.2. HOW

1.2.1. FusionGAN

基于生成对抗网络(GANs)提出新网络,可从多个无标签图像集中获取两个输入图像,生成具有一个输入图像身份和另一个输入图像形状的融合图像,且能同时在多个图像数据集上进行无监督训练。具体地,对于两个输入图像$x=(I_x,S_x)$$y=(I_y,S_y)$,目标是生成融合图像$G(x=(I_x,S_x),y=(I_y,S_y))=(I_x,S_y)$,即输出图像具有x的身份和y的形状。网络不限于两个图像集之间的转换,可用于多个无标签图像集。这里身份可视为图像集级别的特征(如在 VGG YouTube Pose 数据集里是人物身份),形状为实例级别的特征(如人物姿势)。

1.2.2. 损失函数

身份损失$L_{I}$

通过判别器$D$区分输入对是真实对还是生成对,使生成图像的分布与第一个输入图像所属集合的分布相似,以获取图像$x$的身份。采用$L_2$损失替代负对数似然,让生成器$G$最大化

http://www.lryc.cn/news/484824.html

相关文章:

  • 问:SQL优化,七条实践总结?
  • unity单例模式的不同声明(待完善
  • 大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手
  • vue2,vue3响应式的理解
  • 群控系统服务端开发模式-应用开发-前端退出功能
  • Web入门
  • 基于SpringBoot网上超市的设计与实现录像
  • python爬虫(二)爬取国家博物馆的信息
  • 【mysql的当前读和快照读】
  • [CKS] Audit Log Policy
  • 【Linux】-学习笔记03
  • Leetcode热题100-32 最长有效括号
  • 【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据
  • A027-基于Spring Boot的农事管理系统
  • Redisson的可重入锁
  • SQL Server Service Broker完整示例
  • CentOS7 升级OpenSSH9.0全过程和坑
  • RSTP的配置
  • 力扣257:二叉树的所有路径
  • Tcl 和 Python 在二次开发研究
  • 【NLP优化】Ubuntu 20.04 下 源码安装 CasADi + Ipopt / acados
  • [241110] 微软发布多智能体系统Magentic-One | 社区讨论:Ubuntu 26.04 LTS 发布前移除 Qt 5
  • AI风向标|算力与通信的完美融合,SRM6690解锁端侧AI的智能密码
  • MySQL查询执行(六):join查询
  • python习题练习
  • MySQL高级(二):一条更新语句是如何执行的
  • 在 Ubuntu 18.04 中搭建和测试 DNS 服务器
  • 算法学习第一弹——C++基础
  • javaWeb小白项目--学生宿舍管理系统
  • 如何优化Elasticsearch的查询性能?