当前位置: 首页 > news >正文

【论文阅读】Face2Diffusion for Fast and Editable Face Personalization

code:mapooon/Face2Diffusion: [CVPR 2024] Face2Diffusion for Fast and Editable Face Personalization https://arxiv.org/abs/2403.05094 (github.com)

论文

介绍 

目标:向 T2I 模型不知道的图像中插入特定概念(例如某人的脸),从而催生出诸如 TextualInversion 和 DreamBooth的个性化方法。这两个方法学习每个概念需要几十分钟的微调,基于此提出了Face2Diffusion (F2D),用于高可编辑性面部个性化。核心思想是从训练pipeline中删除与身份无关的信息,防止过拟合并提高编码面部的可编辑性。

特点:平衡了身份保真度和文本保真度。三个组件:1)多尺度身份编码器 (MSID) ,提供了解耦的身份特征,同时保留了多尺度信息,提高了相机姿势的多样性。 2)表情引导,将人脸表情与身份分离,提高人脸表情的可控性,可以通过文本提示和参考图像来控制人脸表情。 3)分类引导去噪正则化(CGDR) ,鼓励模型学习如何对面部进行去噪,从而增强背景的保真度。

图 1.  Face2Diffusion 满足复杂的文本提示,文本包括多个条件,同时保留输入的面部身份,无需单独的测试时间调整。

 

方法

实验

 

复现

http://www.lryc.cn/news/441049.html

相关文章:

  • 金钥匙系列:Kubernetes (K8s) 服务集群技术栈学习路线
  • centos远程桌面连接windows
  • Android 系统下:普通应用无缝安装,Launcher 应用安装遭遇罕见障碍解析
  • VMware vCenter Server 8.0U3b 发布下载,新增功能概览
  • Unity 百度AI实现无绿幕拍照抠像功能(详解版)
  • MySQL_表的基本操作
  • 【网站架构部署与优化】源码编译安装LAMP
  • 【Linux】Linux的基本指令(1)
  • Python安装虚拟环境Conda
  • 基于STM32设计的烘干车间远程控制系统(腾讯云IOT)(228)
  • Nginx泛域名 解析的匹配前缀绑定或转发到子目录
  • 黑神话悟空mac可以玩吗
  • Nuxt Kit 中的插件:创建与使用
  • C++(虚构造与虚析构/类型信息运算符/强制类型转换)
  • python毕业设计基于django+vue医院社区医疗挂号预约综合管理系统7918h-pycharm-flask
  • tidb 集群搭建
  • SpringBoot开发——Spring Boot Controller 最佳实践
  • 使用Ubuntu耳机输出正弦波信号
  • Python编程 - 协程
  • 如何在没有备份的情况下恢复 Mac 上丢失的数据
  • SpringBoot:解析excel
  • Tomcat窗口运行修改窗口标题显示项目日期时间
  • 8-----手机机型维修工具助手 功能较全 涵盖解锁 刷机 修复等选项 维修推荐
  • 集群聊天服务器项目【C++】(四)cmake介绍和简单使用
  • Nginx+Tomcat(负载均衡、动静分离)
  • 前端分段式渲染较长文章
  • C#程序员的堕落从nuget开始:将自己的代码发布到nuget
  • 【C/C++语言系列】malloc、calloc和realloc区别和用法
  • 【Linux】POSIX信号量与、基于环形队列实现的生产者消费者模型
  • Spring Boot-消息队列相关问题