当前位置: 首页 > news >正文

机器学习笔记:李宏毅diffusion model

1 概念原理

  • 首先sample 一个都是噪声的vector
  • 然后经过denoise network 过滤一些杂质
  • 接着继续不断denoise,直到最后出来一张清晰图片

  • 【类似于做雕塑,一开始只是一块石头(噪声很杂的雕塑),慢慢雕刻出想要的花纹】

 

 

  • 同一个denoise network的模型反复使用
  • 但每一个stage输入的图片的状况差异很大
  • ——>完全是同一个模型效果不一定好

  • denoise network还多需要一个输入,野鸡现在denoise的阶段
    • 1表示denoise快结束了的阶段
    • 1000表示刚开始denoise的阶段

2   denoise内部原理

  •  预测图片里面的噪声长什么样
  • 输入图片减去输出的噪声,得到这一轮去噪后的图片
    • 预测noise的原因:产生图片和产生noise 难度是不一样的

2.1 noise predictor的ground truth

那么如何训练noise predictor,换句话说,怎么找到ground-truth呢

 

  •  从资料库中拿出图片
  • 再从高斯分布/或者其他分布中产生噪声
  • 将这个噪声加入图片中,就有了带噪声的图片

 这样就形成了一对一对的 输入和ground-truth ,供noise predictor 训练

3 用文字生成图片

如果我们是提供给diffusion model 文字,让他生成图片

 整体的框架没有多少变化,就是 denoise model 输入多了一个文字的vector

 

 

http://www.lryc.cn/news/122992.html

相关文章:

  • STM32--TIM定时器(2)
  • git Authentication failed
  • 【软考】2023系统架构设计师考试
  • opencv基础55-获取轮廓的特征值及示例
  • OpenCV图像处理——形态学操作
  • 修改VS Code终端的显示行数
  • C++学习| MFC简单入门
  • “一日之际在于晨”,欢迎莅临WAVE SUMMIT上午场:Arm 虚拟硬件早餐交流会
  • leetcode454. 四数相加 II
  • PHP证券交易员学习网站mysql数据库web结构apache计算机软件工程网页wamp
  • 对p-n结/AlGaN/GaN HEMTs中n-GaN掺杂浓度对栅极可靠性的影响
  • Mac M2 Pro安装使用Cocoapods
  • 枚举缓存工具
  • 【BASH】回顾与知识点梳理(二十五)
  • 什么是Node js?什么是React?有什么区别
  • 使用postman做接口测试
  • VMware Workstation 如何启用复制粘贴
  • 免费小程序商城搭建之b2b2c o2o 多商家入驻商城 直播带货商城 电子商务b2b2c o2o 多商家入驻商城 直播带货商城 电子商务 bbc
  • VSCode-Python传参数进行Debug
  • 实践-传统深度学习
  • 爬虫:使用Selenium模拟人工操作及获取网页内容
  • AOP开发
  • Streamlit项目: 轻松搭建部署个人博客网站
  • 手把手教你如何实现内网搭建电影网站并进行公网访问(保姆级教学)
  • Redis_事务操作
  • python质检工具(pylint)安装使用总结
  • “深入探究JVM:解密Java虚拟机的工作原理“
  • 同济子豪兄模板 半天搞定图像分类
  • 接口自动化测试,Fiddler使用抓包辅助实战,一篇彻底打通...
  • 概念解析 | 隐式神经表示:揭开神经网络黑盒的奥秘