当前位置: 首页 > news >正文

论文复现3:Stable Diffusion v1

abstract: 通过将图像形成过程分解为去噪自动编码器的顺序应用,扩散模型 (DM) 在图像数据及其他方面实现了最先进的合成结果。此外,他们的公式允许一种指导机制来控制图像生成过程,而无需重新训练。然而,由于这些模型通常直接在像素空间中运行,因此强大的 DM 的优化通常会消耗数百个 GPU 天,并且由于顺序评估,推理成本很高。为了在有限的计算资源上进行 DM 训练,同时保持其质量和灵活性,我们将它们应用在强大的预训练自动编码器的潜在空间中。与之前的工作相比,在这种表示上训练扩散模型首次允许在复杂性降低和细节保留之间达到接近最佳的点,从而极大地提高了视觉保真度。通过将交叉注意力层引入模型架构中,我们将扩散模型转变为强大而灵活的生成器,用于一般调节输入(例如文本或边界框),并且以卷积方式使高分辨率合成成为可能。我们的潜在扩散模型 (LDM) 在图像修复和类条件图像合成方面实现了新的最先进分数,并在各种任务上实现了极具竞争力的性能,包括无条件图像生成、文本到图像合成和超分辨率,同时显着与基于像素的 DM 相比,减少了计算要求。

paper:https://openaccess.thecvf.com/content/CVPR2022/html/Rombach_High-Resolution_Image_Synthesis_With_Latent_Diffusion_Models_CVPR_2022_paper.html
code:https://github.com/CompVis/stable-diffusion.git
huggingface: https://huggingface.co/runwayml/stable-diffusion-v1-5

clone后https://github.com/CompVis/stable-diffusion,开始配置:

359  
http://www.lryc.cn/news/327907.html

相关文章:

  • Halcon与VisionMaster对比
  • 多线程的学习1
  • 警务数据仓库的实现
  • Excel·VBA数组分组问题
  • 【笔记】Hbase基础笔记
  • 创建vue3项目并集成cesium插件运行
  • Mac 装 虚拟机 vmware、centos7等
  • 工厂能耗管控物联网解决方案
  • 中间件学习
  • iOS开发进阶(十一):ViewController 控制器详解
  • 修改mysql密码
  • uniapp 使用命令行创建vue3 ts 项目
  • 一周学会Django5 Python Web开发-Django5模型定义
  • kingbaseESV8逻辑备份还原
  • FreeRtos作业1
  • spring boot dynamic 动态数据数据源配置连接池
  • vue3中如何使用 watch 函数来观察响应式数据的变化
  • 自建机房私有云吗?
  • 解决npm init vue@latest证书过期问题:npm ERR! code CERT_HAS_EXPIRED
  • 缓存和缓存的常用使用场景
  • 模板方法模式(继承的优雅使用)
  • 百度智能云千帆,产业创新新引擎
  • Python下载cuda包失败后到成功(方便使用GPU加速运算,显著提高代码运行速度)
  • 【Flink】Flink 处理函数之基本处理函数(一)
  • 【Java - 框架 - Lombok】(2) SpringBoot整合Lombok完成日志的创建使用 - 快速上手;
  • linux 系统安装php 8.0.2
  • 你管这破玩意叫网络
  • 系统开发实训小组作业week5 —— 用例描述与分析
  • C语言例4-35:鸡翁一,值钱五;鸡母一,值钱三;鸡雏三,值钱一。百钱买百鸡、问鸡翁、鸡母和鸡雏各几何?
  • Leetcode 167. 两数之和 II - 输入有序数组