当前位置：首页 > news >正文

DragGAN：用崭新的方式进行图像处理

news 2025/8/6 11:04:24

该项目的论文被SIGGRAPH 2023 收录，论文以 StyleGAN2 架构为基础，实现了 “Drag” 关键点就能轻松 P 图的效果。

https://github.com/XingangPan/DragGAN

https://vcai.mpi-inf.mpg.de/projects/DragGAN/

目录

原图1
- 测试一
- 测试二
- 测试三
原图2
- 测试一
- 测试二
原图3
- 测试
参考文献

在官方 Demo 中，作者轻触鼠标，一拖一拽，让狗狗微笑、让猫咪"Wink"、让倒影拉长、让太阳升起…完美贴合现实世界的物理结构和物理逻辑。DragGAN 源代码正式放出，目前在 GitHub 上已有超过 20,000 颗星标。

根据论文中的介绍，DragGAN 是一种用于直观基于点的图像编辑的交互方法。利用预先训练的 GAN 来合成不仅精确跟随用户输入的图像，而且停留在真实图像的流形上。与之前的许多方法相比，是一个不依赖于特定领域的建模或辅助网络的通用框架。

这是基于两种新方法实现的：一是对隐编码的优化，这些隐编码增量地将多个抓取点移动到它们的目标位置；二是通过点跟踪过程来准确地跟踪抓取点的轨迹。这两个组件利用 GAN 中间特征图的判别质量来进行图像变形，实现交互性能。目前已经证明，此方法在基于 GAN 的操作中优于最先进的方法，并为使用生成先验的强大图像编辑开辟了新的方向。而对于未来的工作，作者计划将基于点的编辑扩展到 3D 生成模型。

在这里

原图1

在这里插入图片描述

测试一

在这里插入图片描述

在这里插入图片描述

测试二

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

测试三

在这里插入图片描述

原图2

在这里插入图片描述

测试一

在这里插入图片描述

测试二

在这里插入图片描述

原图3

在这里插入图片描述

测试

在这里插入图片描述

参考文献

https://huggingface.co/spaces/DragGan/DragGan

https://openxlab.org.cn/apps/detail/XingangPan/DragGAN

https://zhuanlan.zhihu.com/p/639963515

http://www.lryc.cn/news/102760.html

相关文章：

语音播放 linux

各大互联网公司面经分享：Java 全栈知识 +1500 道大厂面试真题

【LeetCode】剑指offer礼物的最大价值

应用层协议——https

Emacs之实现鼠标/键盘选中即拷贝外界内容(一百二十)

智慧城市环境污染数据采集远程监控方案4G工业路由器应用

大数据技术之Clickhouse---入门篇---安装

vue3搭建Arco design UI框架

提升数据质量的四大有效方式

ALLEGRO之FlowPlan

Python - OpenCV实现摄像头人脸识别（亲测版）

date日期相关操作汇总

生产者-消费者模式

Jetson Nano之ROS入门 -- YOLO目标检测与定位

【移动机器人运动规划】01 —— 常见地图基础 |图搜索基础

mongotop跟踪Mongodb集合读取和写入数据

Linux中使用du命令来查看目录的大小

【Linux】进程篇Ⅰ：进程信息、进程状态、环境变量、进程地址空间

保护 TDengine 查询性能——3.0 如何大幅降低乱序数据干扰？

状态机实现N位按键消抖

uniapp自定义消息语音

k8s安装Jenkins

共筑开源新长城龙蜥社区走进开放原子校源行-清华大学站

Jgit 工具类 (代码检出、删除分支（本地、远程）、新建分支、切换分支、代码提交)

什么是redux？如何在react 项目中使用redux？

mysql的json处理

前端学习——Vue (Day8)

Windows环境下安装及部署Nginx

使用AOP切面对返回的数据进行脱敏的问题

TDengine时区设置