当前位置: 首页 > news >正文

14天手撸交互式问答数字人直播教程-课程计划

一、课程计划

 二、时间安排

第01天:交互式问答数字人发展现状

从一个真实案例开始,介绍当前主流的交互式数字人平台,需求和应用场景,引入交互式数字人的交互流程和关键技术。后续整个直播系列的内容安排。

第02天:音频采集和实时音频推流

介绍基于麦克风的音频采集系统,搭建实时音频推流系统,实现音频实时录制、播放和实时推流。

第03-04天:语音识别:本地离线部署

性能原因考虑,交互式数字人的语音识别采用本地离线部署模式。语音识别离线部署技术选型,模型资源和运行演示。

第05-06天:智能问答:本地chatGPT平替产品离线部署

性能、网络和垂类可用性三个原因考虑,交互式数字人智能问答部分采用本地离线部署模式,这部分介绍当前可用的智能问答系统,重点介绍支持增量微调的开源方案。并演示接入效果。

第07-08天:语音合成:离线部署方案

考虑到性能原因,语音合成部分采用离线部署模式,介绍当前可用的开源语音合成系统和预训练模型。重点介绍支持离线部署的开源方案,并演示部署和接入效果。

第09天:音频特征抽取

结合数字人合成输入需求,进行音频特征抽取,并保存。介绍当前主流的音频特征抽取方案,包括:deepspeech、wav2vec和hubert. 并演示音频特征抽取结果。此处有一个难点就是:如何实现流式处理。

第10-11天:数字人合成:性能极限优化策略

数字人合成方案,采用开源/自研的技术方案,重点介绍如何进行数字人合成的性能提升。在保障效果的情况,性能提升作为第一个要求。

第12天:实时推流:搭建实时推流服务器

实时视频推流服务器技术选型,实时视频推流客户端程序设计,系统联调和运行演示。

第13天:实时播报:实时播报系统设计

实时数字人播报客户端技术选型、程序设计、系统链条和运行演示。

第14天:总结和回顾:扬帆起航

问题总结和回顾,QA答疑。

http://www.lryc.cn/news/58746.html

相关文章:

  • spring boot3.0新特性Http客户端远程调用
  • 查询联系:多表查询 - 1
  • 「Bug」OpenCV读取图像为 None 分析
  • EVO——视觉里程计/SLAM轨迹评估工具
  • TCP为什么要三次握手,而不是两次或四次?
  • git 命令:工作日常使用
  • Http和Https
  • 【计算机网络复习】第三章 传输层 2
  • 你真的会自动化测试?自动化测试技术选型抉择
  • 【id:31】【20分】A. Point(类与构造)
  • ASM字节码处理工具原理及实践(二)
  • Golang每日一练(leetDay0030)
  • QT5.15.2 在线安装下载速度慢的解决办法
  • Cadence Allegro 导出Waived Design Rules Check Report报告详解
  • Java阶段一Day19
  • radmin远程控制软件怎么样,有没有替代品
  • Java反射面试总结(一)
  • 【论文阅读】3D-LaneNet
  • Kafka的概念|架构|搭建|查看命令
  • 大数据项目实战之数据仓库:电商数据仓库系统——第5章 数据仓库设计
  • OpenHarmony社区运营报告(2023年3月)
  • 杰林码图像增强算法——超分辨率、图像放大、轮廓和色彩强化算法(二)
  • 在three.js中废置对象
  • Java中的String类真的不可变吗?
  • 电脑重装了系统开不了机怎么办?
  • SPOJ-NSUBSTR - Substrings(SAM求所有长度子串的最大出现次数)
  • Mariadb10.5基于同服务器多实例主从配置
  • linux 修改主机名称
  • 学校的地下网站(学校的地下网站1080P高清)
  • 勒索病毒是什么?如何防勒索病毒