当前位置: 首页 > news >正文

conda安装及demo:SadTalker实现图片+音频生成高质量视频

1.安装conda

下载各个版本地址:https://repo.anaconda.com/archive/

win10版本: Anaconda3-2023.03-1-Windows-x86_64
linux版本: Anaconda3-2023.03-1-Linux-x86_64

Windows安装
在这里插入图片描述
在这里插入图片描述
环境变量
在这里插入图片描述

conda -V

在这里插入图片描述

2.配置conda镜像源

安装pip

conda install pip

镜像设置

conda config --add channels https://mirrors.aliyun.com/anaconda/pkgs/main

其他镜像源

# 中科大镜像源
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/menpo/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/# 北京外国语大学源
conda config --add channels  https://mirrors.bfsu.edu.cn/anaconda/pkgs/main
conda config --add channels  https://mirrors.bfsu.edu.cn/anaconda/pkgs/free
conda config --add channels  https://mirrors.bfsu.edu.cn/anaconda/pkgs/r
conda config --add channels  https://mirrors.bfsu.edu.cn/anaconda/pkgs/pro
conda config --add channels  https://mirrors.bfsu.edu.cn/anaconda/pkgs/msys2#清华源
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
conda config --add channels  https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2#阿里云
conda config --add channels http://mirrors.aliyun.com/anaconda/pkgs/main
conda config --add channels http://mirrors.aliyun.com/anaconda/pkgs/r
conda config --add channels http://mirrors.aliyun.com/anaconda/pkgs/msys2

pip镜像设置

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

删除指定的镜像源

conda config --remove channels http://mirrors.aliyun.com/anaconda/pkgs/main/

3.常用命令

conda当前的镜像源

conda config --show-sources

创建conda环境 env_name自定义名称
conda create --name <evn_name> <pakages_name> <python = version number >

 conda create -n env_name python==3.10

在指定的目录下创建虚拟环境

conda create --prefix=D:\environment\Python python=3.8
只需要修改D:\environment\Python对应的路径部分即可

激活conda环境,env_name为创建环境时的名称

  activate env_name

退出虚拟环境

 deactivate 

删除指定conda环境,env_name为创建环境时的名称

 conda remove -n env_name --allconda env remove -p F:\conda_work\sadtalker  (指定虚拟环境所在为位置)

在这里插入图片描述
在这里插入图片描述

查看当前存在哪些虚拟环境

conda env list
或者
conda info -e

检查更新当前conda

conda update conda

查看安装了哪些包

conda list

安装包

conda install package_name(包名)

删除虚拟环境中的包

conda remove --name $env_name $package_name

4.遇到的问题

UnavailableInvalidChannel: HTTP 404 NOT FOUND for channel

在这里插入图片描述
解决方案:

conda config --remove-key channels

5.例:运行sadtalker

SadTalker可以实现图片+音频生成高质量视频
项目地址:https://github.com/OpenTalker/SadTalker
SadTalker安装及使用指南

点开项目地址然后将其下载下来然后解压
在这里插入图片描述
在这里插入图片描述
在 sadtalker项目根目录下新建两个目录checkpointsgfpgan,下载好的模型分别放在这两个文件夹
通过网盘分享的GFP-GAN人脸复原模型文件:gfpgan.zip
链接: https://pan.baidu.com/s/1bu8l-cZmmvIYrEJzWwNJ0Q?pwd=4rbc 提取码: 4rbc
通过网盘分享的预训练模型文件:sadtalker_checkpoints_v0.0.2.zip
链接: https://pan.baidu.com/s/1zImWlqI7ll-bowdlNDkLdw?pwd=nsvh 提取码: nsvh
在这里插入图片描述

在其目录下打开cmd
在这里插入图片描述

创建虚拟环境

conda create -n sadtalker python=3.8

在这里插入图片描述

conda env list

在这里插入图片描述

activate sadtalker

在这里插入图片描述

安装依赖包

conda install ffmpeg
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

在这里插入图片描述

安装依赖包会报错一大推error的,切换镜像进行下载
在这里插入图片描述

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 -i https://pypi.tuna.tsinghua.edu.cn/simple

如果切换国内清华源都不好使,说明当前的网络不行,切换为自己的个人热点就可以了

开始使用

python inference.py --driven_audio F:\conda_work\SadTalker\examples\driven_audio\deyu.wav --source_image F:\conda_work\SadTalker\examples\source_image\art_0.png --result_dir F:\temp\sadtalker --still --preprocess full --enhancer gfpgan
F:\conda_work\SadTalker\examples\driven_audio\deyu.wav 替换为你的音频
F:\conda_work\SadTalker\examples\source_image\art_0.png  替换为你的图片
F:\temp\sadtalker  替换为你的输出路径

运行之后一直报错

(sadtalker) F:\conda_work\SadTalker>python inference.py --driven_audio F:\conda_work\SadTalker\examples\driven_audio\deyu.wav --source_image F:\conda_work\SadTalker\examples\source_image\art_0.png --result_dir F:\temp\sadtalker --still --preprocess full --enhancer gfpgan
Traceback (most recent call last):File "F:\conda_work\SadTalker\inference.py", line 10, in <module>from src.facerender.animate import AnimateFromCoeffFile "F:\conda_work\SadTalker\src\facerender\animate.py", line 23, in <module>from src.utils.face_enhancer import enhancer_generator_with_len, enhancer_listFile "F:\conda_work\SadTalker\src\utils\face_enhancer.py", line 4, in <module>from gfpgan import GFPGANerFile "F:\anaconda3\envs\sadtalker\lib\site-packages\gfpgan\__init__.py", line 2, in <module>from .archs import *File "F:\anaconda3\envs\sadtalker\lib\site-packages\gfpgan\archs\__init__.py", line 2, in <module>from basicsr.utils import scandirFile "F:\anaconda3\envs\sadtalker\lib\site-packages\basicsr\__init__.py", line 4, in <module>from .data import *File "F:\anaconda3\envs\sadtalker\lib\site-packages\basicsr\data\__init__.py", line 22, in <module>_dataset_modules = [importlib.import_module(f'basicsr.data.{file_name}') for file_name in dataset_filenames]File "F:\anaconda3\envs\sadtalker\lib\site-packages\basicsr\data\__init__.py", line 22, in <listcomp>_dataset_modules = [importlib.import_module(f'basicsr.data.{file_name}') for file_name in dataset_filenames]File "F:\anaconda3\envs\sadtalker\lib\importlib\__init__.py", line 127, in import_modulereturn _bootstrap._gcd_import(name[level:], package, level)File "F:\anaconda3\envs\sadtalker\lib\site-packages\basicsr\data\realesrgan_dataset.py", line 11, in <module>from basicsr.data.degradations import circular_lowpass_kernel, random_mixed_kernelsFile "F:\anaconda3\envs\sadtalker\lib\site-packages\basicsr\data\degradations.py", line 8, in <module>from torchvision.transforms.functional_tensor import rgb_to_grayscale
ModuleNotFoundError: No module named 'torchvision.transforms.functional_tensor'

这表明 basicsr 或 gfpgan 库中确实存在对这个模块的硬编码引用,并且它在当前版本的 torchvision 中并不存在。

解决方案修改 basicsr 源码:
找到 F:\anaconda3\envs\sadtalker\lib\site-packages\basicsr\data\degradations.py 文件,并将以下行:

from torchvision.transforms.functional_tensor import rgb_to_grayscale

在需要使用 rgb_to_grayscale 的地方,使用 F.rgb_to_grayscale 代替原来的导入方式。
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
然后再此运行生成视频

python inference.py --driven_audio F:\conda_work\SadTalker\examples\driven_audio\deyu.wav --source_image F:\conda_work\SadTalker\examples\source_image\art_0.png --result_dir F:\temp\sadtalker --still --preprocess full --enhancer gfpgan

在这里插入图片描述
在这里插入图片描述
生成成功
在这里插入图片描述

退出虚拟环境
在这里插入图片描述

http://www.lryc.cn/news/516724.html

相关文章:

  • 【面试】后端开发面试中常见数据结构及应用场景、原理总结
  • 141.《mac m系列芯片安装mongodb详细教程》
  • Java 23 集合框架详解:ArrayList、LinkedList、Vector
  • 03、MySQL安全管理和特性解析(DBA运维专用)
  • 创建型模式5.单例模式
  • 用户界面软件02
  • VTK 鼠标+键盘重构
  • go语言处理JSON数据详解
  • 基于gin一个还算比较优雅的controller实现
  • PDFMathTranslate: Star13.8k,一款基于AI的PDF文档全文双语翻译PDF文档全文双语翻译,保留格式神器,你应该需要它
  • Python编程实例-特征向量与特征值编程实现
  • Vue3-跨层组件通信Provide/Inject机制详解
  • Linux Jar包定时重启脚本,按最新时间的Jar包启动
  • HTML5实现好看的博客网站、通用大作业网页模板源码
  • 掌握RabbitMQ:全面知识点汇总与实践指南
  • go如何从入门进阶到高级
  • 在环境冲突情况下调整优先级以解决ROS Catkin构建中缺少模块的问题【ubuntu20.04】
  • github 个人主页配置
  • STM32-笔记30-编程实现esp8266联网功能
  • oscp备考 oscp系列——Kioptix Level 1靶场 古老的 Apache Vuln
  • 《机器学习》——随机森林
  • 指代消解:自然语言处理中的核心任务与技术进展
  • 记录一下Unity webgl cannot read properties of undefined reading apply 错误
  • 【C语言程序设计——选择结构程序设计】求阶跃函数的值(头歌实践教学平台习题)【合集】
  • unity 播放 序列帧图片 动画
  • HTML - <a>
  • Unity学习笔记(六)使用状态机重构角色移动、跳跃、冲刺
  • 【C++数据结构——树】二叉树的遍历算法(头歌教学实验平台习题) 【合集】
  • Android Telephony | 协议测试针对 test SIM attach network 的问题解决(3GPP TS 36523-1-i60)
  • jenkins入门3 --执行一个小demo