当前位置: 首页 > news >正文

文生视频Sora

Sora:scalable diffusion models with transformers 文生视频模型
Sora:视频生成模型60s,视频中体现一定的物理逻辑
时空patch,是Sora创新的核心。
Sora 到底是不是物理引擎甚至世界模型?数据驱动的物理引擎
帆船在水里跟随水流浮力上下起伏体现物理逻辑

生成模型的方法包括GAN、自回归、扩散模型。它们都有各自的优势和局限性。
目前市面上文生视频模型的主流技术路线主要有两种:
(1)一种基于Transformer模型的技术路线,即从文本及图像中生成
(2)另一种则是基于扩散模型(Diffusion model),如 Runway
Sora融合了Diffusion和Transformer架构,结合在一起的Diffusion Transformer模型,
通过扩散模型(DALL-E3)和转换器架构(ChatGPT)组合,Sora不用预测序列中的下一个文本,
而是预测序列中的下一个“Patch”。
Sora引入的,是一种全新的范式转变——新的建模技术和灵活性,可以处理各种时间、纵横比和分辨率。

文生图像/视频常见爆火模型
Dall-E 2021.1 Open AI 文生图模型
Midjourney 2022.3 文生图模型
Stability AI 2023 文生图模型
Runway Stable Diffusion 2022 文生图模型
gen-2 文生视频模型 2023.3 文本、图片、文本+图片直接生成视频
Pika 2023.11.28 文生视频模型 支持生成3D动画、2D动漫、卡通等多种画风的视频
Sora 2024.2.16 Open AI 文生视频模型

http://www.lryc.cn/news/305718.html

相关文章:

  • 汽车常识网:电脑主机如何算功率的计算方法?
  • c语言常见操作符及操作符优先级
  • IO进程线程:通信
  • 神经网络系列---常用梯度下降算法
  • Flink 的历史版本特性介绍(一)
  • 【尚硅谷】MybatisPlus 学习笔记(下)
  • 408数据结构算法模板
  • Mysql--索引分类
  • AutoTimes:通过大语言模型的自回归时间序列预测器
  • 记录 | go与C/C++交互
  • B3623枚举排列
  • vuex怎么防止数据刷新丢失?
  • OpenGL ES 渲染 NV21、NV12、I420、YV12、YUYV、UYVY、I444(建议收藏)
  • 云计算的两地三中心和灾备介绍
  • Spring Bean
  • Linux的时间操作
  • 2024-02-21 作业
  • 平台组成-监控服务
  • 探索分布式强一致性奥秘:Paxos共识算法的精妙之旅
  • 使用 ES|QL 优化可观察性:简化 Kubernetes 和 OTel 的 SRE 操作和问题解决
  • Docker 第十九章 : 阿里云个人镜像仓使用
  • 二、系统知识笔记-系统架构概述
  • 【高德地图】Android高德地图绘制标记点Marker
  • 每天一个知识点 - 如何快速熟悉后端项目
  • 如何将cocos2d-x js打包部署到ios上 Mac M1系统
  • pdffactory pro 8中文破解版
  • 常用ADB命令整理已经ADB键盘输入
  • buuctf_N1BOOK_粗心的小李
  • 爬取链家二手房房价数据存入mongodb并进行分析
  • 论文阅读:Ground-Fusion: A Low-cost Ground SLAM System Robust to Corner Cases