当前位置: 首页 > news >正文

华工研究生语音课

 

这门课讲啥

语音蕴含的信息、语音识别的目的

语音的准平稳性、分帧、预加重、时域特征分析(能量和过零率)、端点检测(双门限法)

语音的基频及检测(主要是自相关法、野点的处理)

声音的产生过程(声门脉冲、声道模型、辐射),两大听觉特性(时频分析和掩蔽效应)

LPC分析(原理、窗函数、建模为全极点模型、最小均方误差、系数的三种解法与对比)

MFCC分析(Mel频率、Mel滤波器组以及这两者设计的原因:模仿人耳听觉特性。同态信号处理方法、复倒谱和倒谱、MFCC求法、差分MFCC)

VQ(简要了解原理、知道一些聚类算法)

谱距离(距离的特性、对数谱距离、倒谱距离、截断倒谱距离)

DTW(为什么要对齐、线性时间规整算法、了解动态规划的思想、约束条件、动态时间规整算法)

DTW模板训练的过程(包括鲁棒性训练和聚类还有一个Casual啥的,三类对比)

语音识别系统的决策准则(k近邻)、两类评价指标(速度和准确率,具体指标有哪些)、语音识别的自适应问题

HMM概念(了解其参数意义、齐次假设、观测独立性假设、两类主要拓扑结构)

HMM三大基本问题以及经典解法(评估、最佳路径、训练。大概知道其解法)

HMM的实际应用问题

 

这门课考啥

贺老师课上讲得比较深入,主要围绕语音识别系统展开,上完对语音识别的经典流程有个了解。但考试考的比较简单,没有计算题,以概念为主,如:

什么是短时平稳

为啥不用矩形窗

解释某个算法某个变量的含义

为啥用从左到右的HMM结构

为啥不用线性时间规整,而去用DTW?

DTW的约束条件

为啥引入差分MFCC

HMM三大问题是什么,对应算法的名字

 

整体来说,课程广度和深度足够,考试也友好,是值得选修的一门课。

 

 

 

 

 

http://www.lryc.cn/news/66313.html

相关文章:

  • KingbaseES 原生XML系列二 -- XML数据操作函数
  • 【Flink】DataStream API使用之源算子(Source)
  • 树莓派硬件介绍及配件选择
  • O2OA (翱途) 平台 V8.0 发布新增数据台账能力
  • 数控解锁怎么解 数控系统解锁解密
  • 3.0 响应式系统的设计与实现
  • Rust 快速入门60分① 看完这篇就能写代码了
  • 【5.JS基础-JavaScript的DOM操作】
  • 【大数据之Hadoop】二十九、HDFS存储优化
  • SuperMap GIS基础产品组件GIS FAQ集锦(2)
  • C语言printf()函数中整型格式说明符详解
  • 阿里云服务器地域和可用区怎么选择合适?
  • Java序列化引发的血案
  • 为Linux系统添加一块新硬盘,并扩展根目录容量
  • 树莓派Opencv调用摄像头(Raspberry Pi 11)
  • 国产ChatGPT命名图鉴
  • 操作系统——进程管理
  • 第四十一章 Unity 输入框 (Input Field) UI
  • 10.集合
  • 强化学习p3-策略学习
  • 初学Verilog语言基础笔记整理(实例点灯代码分析)持续更新~
  • 关于 std::condition_variable
  • 可拓展哈希
  • Java 版 spring cloud 工程系统管理 +二次开发 工程项目管理系统源码
  • 通过伴随矩阵怎么求逆矩阵
  • 巡检机器人之仪表识别系统
  • 面试官反感的求职者(下)
  • 可视化绘图技巧100篇分析篇(二)-生存曲线(LM曲线)(补充篇)
  • 【100%通过率 】【华为OD机试python】钟表重合时刻【 2023 Q1考试题 A卷|100分】
  • Java线程池编码示例