当前位置: 首页 > news >正文

【精华】AIGC启元2024

文章目录

  • AIGC 前沿
    • (1) Gemini 1.5 Pro
    • (2) Sora
    • (3) EMO
    • (4) Playground v2.5
    • (5) VSP-LLM
    • (6) Ideogram.ai
    • (7) LTX studio

AIGC 前沿

(1) Gemini 1.5 Pro

2024.02.16 谷歌新一代多模态大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪称业界最强大模型。

推荐文章: “打假”Sora,谷歌Gemini 1.5 Pro第一波评测出炉|甲子光年
官网链接: https://openai.com/sora

(2) Sora

2024.02.16 Sora文本生成视频的大模型。它所展现出来的能力几乎可以“碾压”目前全球能实现文本生成视频的大模型 包 括 Runway、Pika、Stable Video Diffusion等20多个产品。
用户仅需输入简短一句话,Sora就可生成一段长达60秒的视频,远远超过市面上同类型级别的AI视频生成时长。在此之前,AI视频模型生成时长几乎在10秒以内,而“明星模型” Runway和Pika等也仅有3到4秒。

推荐文章: Sora到底有多强? | 微软最新Sora综述
官网链接: Gemma Open Models

(3) EMO

2024.02.28 生成式AI模型EMO(Emote Portrait Alive)。EMO仅需一张人物肖像照片和音频,就可以让照片中的人物按照音频内容“张嘴”唱歌、说话,且口型基本一致,面部表情和头部姿态非常自然。

推荐文章: 阿里EMO模型,一张照片就能造谣
官网链接: https://humanaigc.github.io/emote-portrait-alive/

(4) Playground v2.5

2024.02.28 Playground在去年发布Playground v2.0之后再次开源新的文生图模型Playground v2.5。相比上一个版本,Playground v2.5在美学质量,颜色和对比度,多尺度生成以及以人为中心的细节处理有比较大的提升。

推荐文章: 超过Midjourney v5.2的开源文生图大模型Playground v2.5来了
官网链接: https://playground.com/

(5) VSP-LLM

2024.02.28 一种通过观察视频中人的嘴型来理解和翻译说话内容的技术,也就是识别唇语。该技术能够将视频中的唇动转化为文本(视觉语音识别),并将这些唇动直接翻译成目标语言的文本(视觉语音翻译)。不仅如此,VSP-LLM还能智能识别和去除视频中不必要的重复信息,使处理过程更加快速和准确。

推荐文章: VSP-LLM:可通过观察视频中人的嘴型来识别唇语
官网链接: https://github.com/sally-sh/vsp-llm

(6) Ideogram.ai

2024.02.29 Ideogram发布了最新的Ideogram1.0图像生成模型,该模型具有强大的文字生成能力和提示词理解能力。Ideogram1.0在文本渲染准确性方面实现了飞跃。

推荐文章:Ideogram 1.0图像生成模型发布 文字生成能力更强大了
官网链接:https://top.aibase.com/tool/ideogram-ai

(7) LTX studio

2024.02.29 生成式AI电影制作平台—LTX Studio,用户只需要输入文本就能生成超25秒的微电影视频,同时可对镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。

推荐文章: 效果比Sora惊艳,著名AI平台大动作!文本生成超25秒视频,带背景音乐、转场等效果
官网链接: https://ltx.studio

http://www.lryc.cn/news/312192.html

相关文章:

  • js对象解构语法
  • flowable使用taskService.addComment新增评论需要full_msg字段进行读取
  • java常用技术栈,java面试带答案
  • 刷题第11天
  • QML中动态增加表格数据
  • OBS插件开发(二)推流实时曲线
  • Linux编程3.3 进程-进程的终止
  • 排序(3)——直接选择排序
  • [LeetBook]【学习日记】数组内重组
  • 【Linux】磁盘情况、挂载,df -h无法看到的卷
  • AIOps实践中常见的挑战:故障根因与可观测性数据的割裂
  • python 远程代码第一次推送
  • C++开发基础之简单的计时器也有适配场景
  • 数电学习笔记——逻辑函数及其描述方法
  • 2024年护眼台灯哪家品牌好?五款优质品牌专业推荐
  • 搜索iconfont或者阿里图标就可以得到免费的图标
  • android实战视频教程,细数Android开发者的艰辛历程
  • nav2_gps_waypoint_follower_demo 不能在ros2 humble中直接使用的解决方法
  • 华为OD机试 - 螺旋数字矩阵
  • Vue响应式内容丢失处理
  • Linux安装Rabbitmq
  • 在nginx 服务器部署vue项目
  • 制作一个简单的HTML个人网页
  • HM2019创建载荷工况
  • Effective C++ 学习笔记 条款14 在资源管理类中小心copying行为
  • c++数据结构算法复习基础-- 3 --线性表-单向链表-笔试面试常见问题
  • 【踩坑专栏】追根溯源,从Linux磁盘爆满排查故障:mycat2与navicat不兼容导致日志暴增
  • DolphinScheduler——奇富科技的调度实践
  • 2024年最全洗地机选购攻略盘点丨希亦、小米、云鲸、海尔洗地机哪款值得入手?
  • HTML笔记3