当前位置: 首页 > news >正文

SPIRE: Semantic Prompt-Driven Image Restoration 论文阅读笔记

在这里插入图片描述

  • 这是一篇港科大学生在google research 实习期间发在ECCV2024的语义引导生成式修复的文章,港科大陈启峰也挂了名字。从首页图看效果确实很惊艳,尤其是第三行能用文本调控修复结果牌上的字。不过看起来更倾向于生成,对原图内容并不是很复原(不过在生成式方法中已经做得很好了),适合超级噪声图这种原图信息丢失十分严重的场景:
    在这里插入图片描述
  • 整体方法流程如下图所示,用的是stable diffusion的框架,甚至模型参数都是pretrain好后fix住的,在此之上,用controlnet的风格添加了另外一部分网络,来接收restoration的描述和degraded image,网络中的feature来调制这个train好的stable diffusion的unet中的feature,然后是可train的:
    在这里插入图片描述
  • 现在diffusion有了两个目标,一个是原有的stable diffusion在denoise的过程中还是文本梯度,另一个是最终生成的图片要和输入的LQ图片内容一致,而这部分梯度分开由需要train的那个网络承担。:
    在这里插入图片描述
  • 可以看到,这个方法的PSNR确实不高,但是视觉效果真的很好,泛化性感觉也不错:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 如果要一言以蔽之,这个工作可以说是controlnet的restoration 特供版,不过确实做得不错,可惜没看到有开源。
http://www.lryc.cn/news/481813.html

相关文章:

  • #揭秘万维网:从静态页面到智能互联网
  • 【计算机基础——数据结构——红黑树】
  • Sentinel — 微服务保护
  • Cynet:全方位一体化安全防护工具
  • python中常见的8种数据结构之一数组的应用
  • 安装多个低版本谷歌Chrome浏览器用于测试,适配Vue3+vite项目
  • UI组件---如何设置el-pagination分页组件的背景色
  • LabVIEW编程过程中为什么会出现bug?
  • 论文阅读《Structure-from-Motion Revisited》
  • RK android14 第三方app获取su权限
  • 线程与进程的区别(面试)
  • OpenDroneMap Webodm
  • Could not create task ‘:shared_preferences_android:generateDebugUnitTestConfig‘
  • CSS教程(四)- 字体
  • 深入理解Java中的Lambda表达式
  • C#里怎么样判断一个数是偶数还是奇数
  • 【论文笔记】Prefix-Tuning: Optimizing Continuous Prompts for Generation
  • GNN系统学习:消息传递图神经网络
  • 基于gewe制作第一个微信聊天机器人
  • 【Python】python使用Moviepy库对mp3文件进行剪切,并设置输出文件的码率
  • 海外云手机在出海业务中的优势有哪些?
  • 这10款PDF转Word在线转换工具的个人使用经历!!
  • 认识QT以及QT的环境搭建
  • Rollup failed to resolve import “destr“ from ***/node_modules/pinia-plugin-pers
  • Python小白学习教程从入门到入坑------第三十课 文件定位操作(语法进阶)
  • 人工智能、机器学习与深度学习:层层递进的技术解读
  • Code Inspector——页面开发提效的神器
  • 如何定制RockyLinux ISO
  • python基于深度学习的音乐推荐方法研究系统
  • 机器学习系列----介绍前馈神经网络和卷积神经网络 (CNN)