当前位置: 首页 > news >正文

浅谈人工智能之基于容器云进行图生视频大模型搭建

浅谈人工智能之基于容器云进行图生视频大模型搭建

根据之前我们所讲过的内容:
文生图
文生视频
我们继续讲解图生视频大模型搭建。

引言

随着深度学习技术的不断发展,图生视频(image-to-video)大模型成为了计算机视觉和自然语言处理领域的一个研究热点。图生视频模型可以根据输入的文本描述生成高质量的视频,广泛应用于艺术创作、广告设计、虚拟现实等领域。本文将介绍如何搭建一个基于iic/Image-to-Video的文生视频大模型。

模型效果展示

我们首先看一下我们对搭建好的模型的效果进行展示,我们输入的图片如下:
在这里插入图片描述## 环境搭建
基于上一篇文生图的模型搭建,我们进行文生视频的搭建。
第一步:依赖安装

pip install modelscope==1.8.4
pip install xformers==0.0.20
pip install torch==2.0.1
pip install open_clip_torch>=2.0.2
pip install opencv-python-headless
pip install opencv-python 
pip install einops>=0.4
pip install rotary-embedding-torch
pip install fairscale 
pip install scipy
pip install imageio
pip install pytorch-lightning
pip install torchsde

第二步:模型下载调用

from modelscope.pipelines import pipeline
from modelscope.outputs import OutputKeyspipe = pipeline(task="image-to-video", model='damo/Image-to-Video', model_revision='v1.1.0', device='cuda:0')# IMG_PATH: your image path (url or local file)
output_video_path = pipe("/root/image.jpg", output_video='./output.mp4')[OutputKeys.OUTPUT_VIDEO]
print(output_video_path)

第三步:大概率情况下会提示没有安装ffmpeg提示

2024-11-26 17:10:12,990 - modelscope - ERROR - Save Video Error with /bin/sh: 1: ffmpeg: not found
2024-11-26 17:10:12,996 - modelscope - WARNING - task image-to-video output keys are missing

第四步:安装ffmpeg

sudo apt update
sudo apt install ffmpeg

第五步:再次跑py脚本,我就可以获得对应的输出视频了,如果上述跑脚本的时候提示缺少对应依赖,根据提示信息再对对应依赖进行安装部署。

http://www.lryc.cn/news/494626.html

相关文章:

  • 大型复杂项目管理怎么结合传统与敏捷
  • 家校通小程序实战教程04教师管理
  • UI控件使用说明
  • 树莓派2安装jupyterlab以便更好的编程体验
  • 计算机网络常见面试题总结(上)
  • k8s 亲和性之Affinity
  • SpringBoot 插件化开发模式
  • 基于树莓派的安保巡逻机器人--项目介绍
  • Python学习笔记8-函数1
  • 如何使用ST7789展现图片?[ESP--4]
  • 【QNX+Android虚拟化方案】129 - USB眼图参数配置
  • 【机器学习】探索机器学习决策树算法的奥秘
  • K8S版本和istio版本的对照关系
  • 嵌入式硬件实战提升篇(三)商用量产电源设计方案 三路电源输入设计 电源管理 多输入供电自动管理 DCDC降压
  • 【机器学习】机器学习的基本分类-监督学习-逻辑回归-Sigmoid 函数
  • EasyDarwin搭建直播推流服务
  • 无人机数据处理系统:原理与核心系统
  • DLL中的inline static成员变量:Windows开发中的常见陷阱
  • pandas 读写excel
  • 记录Threadlocal使用
  • 2024 ccpc 辽宁省赛 E(构造 思维?)L(二分+一点点数论知识?)
  • 【iOS】设计模式的六大原则
  • 网络安全:攻防技术-Google Hacking的实现及应用
  • 输入一行字符,分别统计出其中英文字母、空格、数字和其它字符的个数。-多语言
  • 2-2-18-9 QNX系统架构之文件系统(三)
  • 各大浏览器(如Chrome、Firefox、Edge、Safari)的对比
  • nginx搭建直播推流服务
  • 单片机-- 松瀚sonix学习过程
  • 循环神经网络:从基础到应用的深度解析
  • 从扩散模型开始的生成模型范式演变--SDE