当前位置: 首页 > news >正文

多模态MLLM都是怎么实现的(2)-DDPM

上一篇的链接:多模态MLLM都是怎么实现的(2) (qq.com)

上上篇的链接:多模态MLLM都是怎么实现的(1) (qq.com)

      在第一篇我们简单介绍了一下多模态训练的原理,包括clip,第二篇正好Sora横空出世,也让我就Dit做了一下抛砖引玉,顺便讲了VAE和ViT的部分,上节课我说过,  DiT它就不是一个模型,它包含了VAEencoder+ViT + DDPM + VAE decoder, 其实最核心的部分就是DDPM,也就是Denoising Diffusion Probabilistic Models。

       就DDPM本身而言各个解决方案都有自己的DDPM方法,它严格说也没那么绝对统一,但是大体思路都是靠diffusion算法来搞的,为了让大家更好理解,我从Diffusion算法开始讲起。

       论文链接:2006.11239.pdf (arxiv.org)

       这个论文真的好久了ÿ

http://www.lryc.cn/news/311314.html

相关文章:

  • QT----写完的程序打包为APK在自己的手机上运行
  • Windows C++ SecurityImpersonation级别:线程临时采用另一个用户(客户端)的身份进行操作的能力
  • 重学SpringBoot3-yaml文件配置
  • 【管理咨询宝藏资料33】某头部咨询公司组织效能提升模型方案
  • 特征值和特征向量及其在机器学习中的应用
  • 【Vue3】Ref 和 ShallowRef 的区别
  • Linux - 进程概念
  • H5小游戏,象棋
  • LLM春招准备(1)
  • 网络安全知识点总结
  • 服务完善的智能组网系统?
  • VS2022如何添加行号?(VS2022不显示行号解决方法)
  • 125.验证回文字符串
  • Spring Boot的启动流程(个人总结,仅供参考)
  • 用BIO实现tomcat
  • JS逆向进阶篇【去哪儿旅行登录】【下篇-逆向Bella参数JS加密逻辑Python生成】
  • 【机器学习】生成对抗网络GAN
  • centos7安装kafka、zookeeper
  • 基于 STM32U5 片内温度传感器正确测算温度
  • 【比较mybatis、lazy、sqltoy、mybatis-flex、easy-query操作数据】操作批量新增、分页查询(三)
  • Leetcode 3068. Find the Maximum Sum of Node Values
  • 用 Dockerfile为镜像添加SSH服务
  • Maven能解决什么问题?为什么要用?
  • 【Golang星辰图】探索网络和HTTP的奇妙世界:使用Go语言打造高性能应用
  • [C语言]——操作符
  • iview碰到的一些问题总结
  • 【Python笔记-FastAPI】后台任务+WebSocket监控进度
  • 力扣hot100:15.三数之和(双指针/哈希表)
  • VMware虚拟机使用Windows共享的文件夹
  • 利用Python自动化日常任务