当前位置：首页 > news >正文

红衣大叔讲AI：从OpenAI发布首个视频大模型Sora，谈2024年视觉大模型的十大趋势

news 2025/7/14 11:20:05

OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解，通过文本指令，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。

OpenAI发布首个视频大模型Sora，一句话生成一分钟视频。Sora可以直接输出有多个角色、多种场景和运镜的画面。比如一段提示词为：镜头穿过熙熙攘攘的东京街道，跟随几个人享受雪天并逛街。在Sora生成的视频中，镜头从天空的雪花中俯冲，跟着一对牵手的情侣，走过日本风格的街道。

2024年视觉大模型的十大趋势：

AI电影将无处不在，无时不有
人类正式进入视觉生产力时代，视觉时代
视觉大模型将无处不在，无时不有
人人皆成网红和导演
视频提示工程元年
RAG视觉知识库增强检索
AI Agent人工智能体元年
视频大模型微调
AIGC（生成式人工智能）正式开启AIGC时代
人人开启元宇宙时代

Sora视觉大模型的技术原理：

Sora继承了DALL-E 3的画质和遵循指令能力，可以根据用户的文本提示创建逼真的视频，该模型可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景，能理解用户在提示中提出的要求，还了解这些物体在物理世界中的存在方式。

http://www.lryc.cn/news/300509.html

相关文章：

java远程连接Linux执行命令的三种方式

JavaScript- let var const区别

指针的经典笔试题

书生浦语大模型实战营-课程笔记（1）

磁盘database数据恢复: ddrescue，dd和Android 设备的数据拷贝

SpringMVC-入门

需要学习的知识点清单

杂谈--spconv导出中onnx的扩展阅读

嵌入式培训机构四个月实训课程笔记（完整版）-Linux ARM驱动编程第二天-arm ads下的start.S分析（物联技术666）

STL之list容器的介绍与模拟实现+适配器

Leetcode With Golang 二叉树 part1

tcp 中使用的定时器

黑马Java——IO流

re:从0开始的CSS学习之路 11. 盒子垂直布局

Kindling-OriginX 如何集成 DeepFlow 的数据增强网络故障的解释力

轻松掌握Jenkins执行远程window的Jmeter接口脚本

Matlab绘图经典代码大全：条形图、极坐标图、玫瑰图、填充图、饼状图、三维网格云图、等高线图、透视图、消隐图、投影图、三维曲线图、函数图、彗星图

姿态传感器MPU6050模块之陀螺仪、加速度计、磁力计

MySQL 基础知识（一）之数据库和 SQL 概述

挑战杯 wifi指纹室内定位系统

Midjourney提示词风格调试测评

Codeforces Round 926 (Div. 2)(A~C)

Godot 游戏引擎个人评价和2024年规划(无代码)

Win11关闭Windows Defender实时保护，暂时关闭和永久关闭方法 | Win10怎么永久关闭Windows Defender实时保护

C# CAD2016 宗地生成界址点，界址点编号及排序

[ai笔记7] google浏览器ai学习提效定制优化+常用插件推荐

联想thinkpad-E450双系统升级记

Mysql运维篇（四） Xtarbackup--备份与恢复练习