当前位置: 首页 > news >正文

干货分享|如何使用Stable Diffusion打造会说话的数字人?

数字人已不是什么新鲜名词了。在许多领域,尤其是媒体和娱乐领域,经常可以看到卡通形象的人物或逼真的虚拟主持人。在Stable Diffusion中,我们可以上传一段录制好的音频文件,然后使用SadTalker插件,将音频和图片相结合,让图片上的角色开口说话。

在 WebUI中单击 “SadTalker”选项卡,在 “上传图像”窗口中上传角色图片,在“上传音频或TTS”窗口中上传音频文件,如图所示。

在右侧的“设置”窗口中选择脸部模型的分辨率,勾选“使用GFPGAN增强面部” 复选框,然后单击“生成”按钮,如图所示。

提 示: 

上传的音频时 长决定了生成视频的时长,在 绘世启动器进程窗口的底部可 以查看生成进度。

视频生成完毕后,我们可以在下方的窗口中预览视频效果。单击WebUI上方的“设 置”选项卡,在左侧的列表中单击“SadTalker”,就能看到视频文件的输出路径,如图所示。

相对于其他插件来说 , SadTalker的配置较为复杂。如果配 置出现问题导致在输出路径中找不到 视频文件,则可以单击预览窗口右上 角的 按钮手动保存处理好的视频文 件,如图所示。

在“预处理”选项组中有5 个选项,其中“裁剪”和“裁剪 后扩展”选项会把上传的原图裁 剪成只留下角色的面部,让头部 运动看起来更加自然,如图所示。

“完整”选项不对参考图进行裁 剪,因此当角色的头部运动较大时, 可能出现脖子区域撕裂的问题。此时 需要勾选“静止模式”复选框,以 减少角色的头部运动。“缩放”选项 让参考图的背景和角色的身体产生缩 放和平移运动,脖子区域的撕裂问题 仍然存在,并且运动的效果也不够自 然。另外,选择“填充至完整”选项 会用参考图填充头部以外的区域,但 如果参考图的宽高比不是1:1,可能会出现严重的画面撕裂,如图所示。

本期内容就到此啦,下期讲解如何快速打造瞬息全宇宙,关注我不迷路,有机会白嫖书籍哦!

本文摘自《解密AI绘画与修图:Stable Diffusion+Photoshop》,获出版社和作者授权发布。

解密AI绘画与修图:Stable Diffusion+Photoshop——jd

http://www.lryc.cn/news/424603.html

相关文章:

  • OrangePi AIpro学习4 —— 昇腾AI模型推理 C++版
  • vue js 多组件异步请求解决方案
  • 【Android】不同系统版本获取设备MAC地址
  • 残差网络--NLP上的应用
  • 1章4节:数据可视化, R 语言的静态绘图和 Shiny 的交互可视化演示(更新2024/08/14)
  • 浅谈个人用户如何玩转HTTP代理
  • 动手研发实时口译系统
  • C#(asp.net)电商后台管理系统-计算机毕业设计源码70015
  • Unity 中创建动画的教程
  • 2024年最全渗透测试学习指南,小白也能轻松hold住!零基础到精通,看完这篇就够了!
  • 有道云docx转换markdown,导入hugo发布到github page,多平台发布适配
  • 如何理解:进程控制
  • 工业互联网边缘计算实训室解决方案
  • Android全面解析之Context机制(一) :初识Android context
  • 气象百科——气象监测站的介绍
  • 学懂C++(三十):高级教程——深入解析 C++ Windows API 的多线程支持
  • 苹果笔记本电脑可以玩steam游戏吗 MacBook支持玩steam游戏吗 在Steam上玩黑神话悟空3A大作 苹果Mac怎么下载steam
  • 海康摄像头(测温型)桌面客户端开发分享
  • 骑行耳机哪个品牌性价比高?精选五大畅销骑行耳机推荐!
  • libcurl8.9.1 上传json
  • 什么是暗水印?企业暗水印如何实施?企业保护利器
  • Qt 系统相关 - 文件
  • Android Toast居中显示方法二
  • Vue启动时报异常 ‘error:03000086:digital envelope routines::initialization error‘
  • C#委托—马工教你轻松玩转委托
  • 当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍
  • NPM 使用教程:从入门到精通
  • 基于ssm+vue+uniapp的停车场小程序的设计与实现
  • C语言典型例题37
  • 二自由度机械臂软件系统(三)ros2_control硬件底层插件