当前位置：首页 > news >正文

【论文阅读】Face2Diffusion for Fast and Editable Face Personalization

news 2025/7/29 16:12:40

code：mapooon/Face2Diffusion: [CVPR 2024] Face2Diffusion for Fast and Editable Face Personalization https://arxiv.org/abs/2403.05094 (github.com)

论文

介绍

目标：向 T2I 模型不知道的图像中插入特定概念（例如某人的脸），从而催生出诸如 TextualInversion 和 DreamBooth的个性化方法。这两个方法学习每个概念需要几十分钟的微调，基于此提出了Face2Diffusion (F2D)，用于高可编辑性面部个性化。核心思想是从训练pipeline中删除与身份无关的信息，防止过拟合并提高编码面部的可编辑性。

特点：平衡了身份保真度和文本保真度。三个组件：1）多尺度身份编码器 (MSID) ，提供了解耦的身份特征，同时保留了多尺度信息，提高了相机姿势的多样性。 2）表情引导，将人脸表情与身份分离，提高人脸表情的可控性，可以通过文本提示和参考图像来控制人脸表情。 3）分类引导去噪正则化(CGDR) ，鼓励模型学习如何对面部进行去噪，从而增强背景的保真度。

图 1. Face2Diffusion 满足复杂的文本提示，文本包括多个条件，同时保留输入的面部身份，无需单独的测试时间调整。

方法

实验

复现

http://www.lryc.cn/news/441049.html

相关文章：

金钥匙系列：Kubernetes (K8s) 服务集群技术栈学习路线

centos远程桌面连接windows

Android 系统下：普通应用无缝安装，Launcher 应用安装遭遇罕见障碍解析

VMware vCenter Server 8.0U3b 发布下载，新增功能概览

Unity 百度AI实现无绿幕拍照抠像功能（详解版）

MySQL_表的基本操作

【网站架构部署与优化】源码编译安装LAMP

【Linux】Linux的基本指令（1）

Python安装虚拟环境Conda

基于STM32设计的烘干车间远程控制系统(腾讯云IOT)(228)

Nginx泛域名解析的匹配前缀绑定或转发到子目录

黑神话悟空mac可以玩吗

Nuxt Kit 中的插件：创建与使用

C++（虚构造与虚析构/类型信息运算符/强制类型转换）

python毕业设计基于django+vue医院社区医疗挂号预约综合管理系统7918h-pycharm-flask

tidb 集群搭建

SpringBoot开发——Spring Boot Controller 最佳实践

使用Ubuntu耳机输出正弦波信号

Python编程 - 协程

如何在没有备份的情况下恢复 Mac 上丢失的数据

SpringBoot：解析excel

Tomcat窗口运行修改窗口标题显示项目日期时间

8-----手机机型维修工具助手功能较全涵盖解锁刷机修复等选项维修推荐

集群聊天服务器项目【C++】（四）cmake介绍和简单使用

Nginx+Tomcat（负载均衡、动静分离）

前端分段式渲染较长文章

C#程序员的堕落从nuget开始：将自己的代码发布到nuget

【C/C++语言系列】malloc、calloc和realloc区别和用法

【Linux】POSIX信号量与、基于环形队列实现的生产者消费者模型

Spring Boot-消息队列相关问题