当前位置: 首页 > news >正文

独家 | Gen-1——可以改变视频风格的AI模型

f812cd37779b681c04ad6fc9e78a7681.png

翻译:吴振东校对:张睿毅本文约1000字,建议阅读3分钟
本文简单介绍了Runway公司的发展史,以及他们新推出的生成式AI模型Gen-1,可用于通过应用文本提示或者参考图像所指定的任意风格,将现有视频转换为新视频。

Runway公司新推出了一款名为Gen-1的模型,可以用来改变视频或电影的现有视觉风格。

生成式AI(AIG)初创公司Runway在去年合作开发了Stable Diffusion,这是具一款有突破意义的文本到图像模型。该公司现在发布了名为Gen-1的人工智能模型,可以通过应用文本提示或者参考图像所指定的任意风格,将现有视频转换为新视频。

在其官方网站发布的一段演示视频中,Runway展示了他们的软件如何将街道上的行人变成黏土木偶,将桌子上的书变成夜晚的风景。Runway希望Gen-1能够像Stable Diffusion在图像领域上的那样,为视频领域做出贡献。Runway公司CEO兼联合创始人Cristóbal Valenzuela表示:“我们曾见证过图像生成模型的大爆发,我坚信2023年会是属于视频生成模型的一年。”

Runway成立于2018年,多年来致力于人工智能视频编辑软件的研发。抖音和YouTube用户以及主流电影和电视剧工作室都在使用他们的工具。斯蒂芬-科尔伯特(扣扣熊)主持的《深夜秀》的制作人使用Runway软件来编辑节目画面;热门电影《瞬息全宇宙》的视觉效果团队利用Runway公司的技术创建了一些场景。

2021年,Runway与慕尼黑大学的研究人员合作开发了第一代Stable Diffusion。总部位于英国的初创公司Stability AI随后参与该项目,承担了在更多数据上训练模型所需的计算费用。2022年,Stability AI使得Stable Diffusion成为主流,将其从一个研究项目转变成一个全球现象。

然而现在两家公司已不再合作。Getty公司目前正在对Stability AI采取法律诉讼,声称该公司未经允许就在Stable Diffusion的训练集中使用了Getty的图片。如此一来Runway选择和他们保持距离。

视频下载地址:

https://wp.technologyreview.com/wp-content/uploads/2023/02/2-Storyboard-Mode.mov

Gen-1对于Runway来说是全新的开始。他们在去年发布了一个类似于文本转视频的模型,就像Meta的Make-a-Video和谷歌的Phenaki模型一样,这些种模型都可以从头生成非常短的视频片段。该模型也与谷歌在上周发布的生成式AI模型Dreamix有些相似,后者可以通过应用特定的风格从现有视频中创建出新的视频。不过根据Runway的实际演示视频来看,Gen-1的视频质量似乎有所提升。因为它可以转换现有的一组镜头,也可以制作比之前那些模型所生成的时长长得多的视频(该公司表示,未来几天将在官网上发布更多关于Gen-1的细节)。

与Meta和谷歌不同的是,Runway所制作的模型都是以客户为出发点的。Valenzuela表示:“这是首批与视频制作者社区密切合作开发的模型之一,得益于多年来对电影制片人和视觉特效剪辑师如何进行后期制作的深入了解。”

Gen-1模型正在云端运行,通过Runway的网站,现在向少数受邀客户开放,几周后将会向等候名单上的用户开放。

去年生成式AI技术呈爆发式增长,得益于数百万人第一次接触到如此强大的创意工具,他们愿意将自己使用的成果分享给他人。Valenzuela希望将Gen-1交到有创造力的专业人士手中,从而很快在视频界产生类似效果的影响。

Valenzuela说道:“我们已经非常接近制作完整的故事片了。我们即将实现这一目标:到那时候你们在网上看到的大部分内容都是生成式(AIG)的。”

原文标题:

The original startup behind Stable Diffusion has launched a generative AI for video

原文链接:

https://www.technologyreview.com/2023/02/06/1067897/runway-stable-diffusion-gen-1-generative-ai-for-video/

封面视频:

https://wp.technologyreview.com/wp-content/uploads/2023/02/Scuba-Example.mp4

编辑:于腾凯

校对:林亦霖

译者简介

5ba97fdd18bd387255f0aaf8df1dc739.jpeg

吴振东,法国洛林大学计算机与决策专业硕士。现从事人工智能和大数据相关工作,以成为数据科学家为终生奋斗目标。来自山东济南,不会开挖掘机,但写得了Java、Python和PPT。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

481e1e0463a7aa3abad966c52fa115f6.png

点击“阅读原文”拥抱组织

http://www.lryc.cn/news/21899.html

相关文章:

  • 戴尔dell inspiron-5598电脑 Hackintosh 黑苹果efi引导文件
  • 3.2 网站图的爬取路径
  • 《SQL基础》12. SQL优化
  • fork之后是子进程先执行还是父进程先执行
  • 2023年java初级面试题(5道)
  • 【内网安全】——Linux权限维持
  • Linux 真实使用内存计算
  • Unity Jobsystem ECS
  • Java中创建线程有哪几种方式
  • C++【string类用法详细介绍string类模拟实现解析】
  • 常见的开发模型和测试模型
  • 印度和印度尼西亚有什么关系吗?
  • 单调栈(C/C++)
  • 算法设计与智能计算 || 专题一: 算法基础
  • 用javascript分类刷leetcode13.单调栈(图文视频讲解)
  • 英语基础语法学习(B站英语电力公司)
  • 【计算机网络】网络层IP协议
  • Eclipse快捷键大全
  • JavaScript 高级2 :构造函数和原型 d331702016e84f54b3594ae05e0eeac
  • maven-war-plugin插件 overlays maven-war-plugin翻译
  • 【数据结构】初识二叉树(二叉树的入门知识)
  • RV1126笔记三十二:基于 FastDeploy 在 RV1126 上的部署示例(RV1126 上部署 YOLOv5 检测模型测试)
  • JVM垃圾回收——G1垃圾收集器
  • C语言深度剖析:关键字
  • 聊一聊过度设计!
  • 程序员在小公司(没有大牛,人少)怎么成长?
  • 【Fastdfs实战】在本地如何将文件上传到Linux虚拟机
  • ERP 系统的应用对企业财务会计信息系统内部控制的影响
  • 智慧物联网源码带手机端源码 物联网系统源码
  • AI绘画进军三次元,有人用它打造赛博女友?(diffusion)