当前位置: 首页 > news >正文

TANGO - 数字人全身动作生成

在这里插入图片描述

文章目录

    • 一、关于 TANGO
      • 演示视频(YouTube)
      • 📝发布计划
    • 二、⚒️安装
      • 克隆存储库
      • 构建环境
    • 三、🚀训练和推理
      • 1、推理
      • 2、为自定义字符创建图形


一、关于 TANGO

TANGO 是 具有分层音频运动嵌入 和 扩散插值的共语音手势视频再现

由东京大学和 CyberAgent AI Lab 联合开发

  • github : https://github.com/CyberAgentAILab/TANGO
  • 官网:https://pantomatrix.github.io/TANGO/
  • huggingface 试用: https://huggingface.co/spaces/H-Liu1997/TANGO
  • paper : https://arxiv.org/abs/2410.04221
  • YouTube : https://www.youtube.com/watch?v=_DfsA11puBc

参考文章:开源版Heygen!TANGO数字人,瞄准全身动作生成,本地部署实测
https://mp.weixin.qq.com/s/3br-2dP2GmrhqqHY4cbpmg


演示视频(YouTube)

https://youtu.be/xuhD_-tMH1w?si=Tr6jHAhOR1fxWIjb

在这里插入图片描述


📝发布计划

  • AuMoClip和ACInterp的训练代码
  • ACInterp的推理码
  • 处理YouTube商业视频数据(非常小,约15分钟)
  • 创建手势图的脚本
  • 带有AuMoClip和预训练权重的推理码

二、⚒️安装


克隆存储库

git clone https://github.com/CyberAgentAILab/TANGO.git
cd TANGO
git clone https://github.com/justinjohn0306/Wav2Lip.git
git clone https://github.com/dajes/frame-interpolation-pytorch.git

构建环境

我们推荐一个python版本==3.9.20和cuda版本==11.8。然后构建环境如下:

# [Optional] Create a virtual env
conda create -n tango python==3.9.20
conda activate tango
# Install with pip:
pip install -r ./pre-requirements.txt
pip install -r ./requirements.txt

三、🚀训练和推理


1、推理

这是在路径<your root>/TANGO/下运行推理脚本的命令,生成两个8s vido大约需要3分钟。您可以通过直接检查视频或使用我们在EMAGE中的搅拌机插件通过搅拌机检查结果. npz文件来可视化。

第一次运行时将自动下载必要的检查点和预先计算的图表。请确保至少有35GB的磁盘空间可用。

python app.py

2、为自定义字符创建图形

python create_graph.py

2025-01-06(一)

http://www.lryc.cn/news/518379.html

相关文章:

  • springboot集成整合工作流,activiti审批流,整合实际案例,流程图设计,流程自定义,表单配置自定义,代码demo流程
  • Windows 10 ARM工控主板连接I2S音频芯片
  • 单元测试MockitoExtension和SpringExtension
  • 网络安全 | WAF防护开通流程与技术原理详解
  • 模型 断裂点理论(风险控制)
  • 02.MPLS动态LSP配置实验
  • MySQL 中的Buffer Pool
  • 修复微pe系统uefi引导损坏windows failed to start...
  • 【Vue3中使用crypto-js】crypto-js加密解密用法
  • JavaWeb开发(九)JSP技术
  • PADS Lyout布局布线实战技巧:布线优化及解决碎铜问题
  • 上下游服务间解耦的技术与管理
  • 如何解决HTML和CSS相关的问题,什么情况下会导致元素被遮挡?
  • Infineon PSoC 4 CapSense ModusToolbox IDE - 系统生态篇
  • [算法]布隆过滤器
  • 基于云效 Windows 构建环境和 Nuget 制品仓库进行 .Net 应用开发
  • Backend - C# asp .net core
  • 【合作原创】使用Termux搭建可以使用的生产力环境(九)
  • 使用Supervisor在Ubuntu中实现后台自启动服务
  • AIDD-人工智能药物设计-人工智能驱动的罕见病药物发现
  • 安卓硬件加速hwui
  • TDv2:一种用于离线数学表达式识别的新型树形结构解码器
  • Golang学习笔记_23——error补充
  • 邯郸地标美食导游平台的设计与实现
  • 滑动窗口限流算法:基于Redis有序集合的实现与优化
  • Angular 最新版本和 Vue 对比完整指南
  • DAY39|动态规划Part07|LeetCode:198.打家劫舍、213.打家劫舍II、337.打家劫舍III
  • MYSQL----------------sql 优化
  • 深度学习中的正则化方法
  • 前端报告 2024:全新数据,深度解析未来趋势