当前位置: 首页 > news >正文

Stable Diffusion WebUI安装合成面部说话插件SadTalker

SadTalker可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。

安装ffmpeg

下载地址:

https://www.gyan.dev/ffmpeg/builds/

下载ffmpeg-git-full.7z 后解压,将解压后的目录\bin添加到环境变量的Path中。

在终端输入ffmpeg命令,查看ffmpeg是否安装成功。

安装SadTalker插件

在WebUI的extensions选项卡下,使用“Install from URL”安装SadTalker插件。

插件地址:

https://github.com/OpenTalker/SadTalker

下载checkpoint

下载地址:

https://github.com/OpenTalker/SadTalker/releases

将下载下来的checkpoint放入stable-diffusion-webui/extensions/SadTalker/checkpoints/目录下。

使用SadTalker

重新启动WebUI,可以看到多出来一个SadTalker选项卡。

参数说明:

  • Source image,原始图片,最好是大头,不然会显得不自然
  • Input audio,输入音频,使用SadTalker示例的音频测试(\extensions\SadTalker\examples\driven_audio)
  • preprocess,图像预处理方式,crop(剪裁), resize(重置大小), full(原图),其中crop根据面部关键点生成的表情和动画相对逼真,前提是不要全图,看起来会很怪
  • Still Mode (fewer head motion, works with preprocess `full`),使用与原始图像相同的姿势,减少头部运动。这个选项在full(原图)的时候很有必要,优化人物头部运动,生成的视频更加自然。
  • GFPGAN as Face enhancer,勾选上, 可以获得更好的面部质量
http://www.lryc.cn/news/271773.html

相关文章:

  • CSS 纵向顶部往下动画
  • 科普:敏捷估算为什么用斐波那契数列
  • HarmonyOS资源分类与访问
  • message: 没有找到可以构建的 NPM 包,请确认需要参与构建的 npm 都在 `miniprogra
  • 基于C#的机械臂欧拉角与旋转矩阵转换
  • 【百度前端三面面试题】
  • 【Java面试题】HTTP与 HTTPS 的区别
  • vue3 v-model语法糖
  • 【k8s】deamonset文件和说明
  • Zookeeper-Zookeeper特性与节点数据类型详解
  • 云计算复习提纲
  • Vue-响应式数据
  • Vue开发者必备!手把手教你实现类似Element Plus的全局提示组件!
  • 大数据 - Hadoop系列《三》- HDFS(分布式文件系统)概述
  • Golang标准库sync的使用
  • 判断两张图片是否完全一致
  • 2024洗地机哪家强?口碑洗地机推荐
  • k8s的资源管理
  • docker应用部署(部署MySql,部署Tomcat,部署Nginx,部署Redis)
  • 非常好用的ocr图片文字识别技术,识别图片中的文字
  • 20231227在Firefly的AIO-3399J开发板的Android11的挖掘机的DTS配置单后摄像头ov13850
  • Unity中Shader裁剪空间推导(透视相机到裁剪空间的转化矩阵)
  • 企业签名分发对移动应用开发者有什么影响
  • 3D游戏角色建模纹理贴图处理
  • 【C++ 单例模式】
  • React16源码: ConcurrentMode的使用及源码实现
  • SQL性能优化-索引
  • Ubuntu本地快速搭建web小游戏网站,公网用户远程访问
  • easyrecovery 2024最新免费密钥分享 实用数据恢复软件分享
  • 2.4信道复用技术