当前位置: 首页 > news >正文

Hidden Marlov Model(HMM)

一、Model

1、将声学特征设为X,经过语音识别得到的tokens设为Y,目标是找到通过X得到Y的最大概率,可以通过概率公式改变为

分为两个概率

2、将tokens序列Y转化为states序列S,声学特征分得更细

3、从states到声学特征的过程

二、HMM中从P(X|Y) -> P(X|S)

1、Transition Probability:从一个state转化为别的state的可能性

2、Emission Probability:前提是,人在发每一个state时,都有固定概率的声音信号

3、最终形态为Subspace GMM,所有的state共用一个Gaussian Mixture池

三、alignment

1、用于计算Emission概率

2、穷举所有alignment序列

3、计算

四、DL用于语音识别

1、Tandem:语音辨识HMM系统不变,唯一变化的是使用DNN(state classifer)给我们比较好的state(从声学特征到state),其他不变

2、DNN-HMM Hybrid

(1)将Gaussian Mixture Model使用DNN取代掉,也就是将得到P(x|a)转化为P(a|x)。

(2)通过概率公式转化

(3)train state classifier

a、使用DNN-HMM Hybrid得出state与声学特征对应的最大概率关系

b、有了对应关系可以训练classifier(DNN)

c、如果想要更精确,可以使用训练出来的更精确的classifier作为寻找state与声学特征对应关系的Model,训练处DNN2。

http://www.lryc.cn/news/424969.html

相关文章:

  • mamba的安装及下载速度慢问题解决
  • 【Linux入门】Linux环境搭建
  • CPU缓存一致性机制详解
  • Android 12系统源码_屏幕设备(一)DisplayManagerService的启动
  • 《AI视频类工具之十——​D-ID》
  • 【网络】局域网LAN、广域网WAN、TCP/IP协议、封装和分用
  • 我司搜索中台的三次演变
  • html+css+js网页设计 电商模版4个页面
  • 区块链技术在Facebook中的潜力:未来趋势与挑战
  • dockerfile自定义镜像
  • 【工作状态】如何保持专注?
  • 欧科云链研究院对话:风浪越大鱼越贵—链上数据洞悉加密市场规律
  • SQLite库笔记:日期和时间函数
  • Linux开发板运行报错/system/bin/sh: can‘t create /dev/leds: Permission denied
  • 月薪5W的项目经理是如何面试的?这份面试攻略请收好!
  • 接口隔离原则
  • 【C++ 面试 - 基础题】每日 3 题(十六)
  • 端到端测试自动化:使用JavaScript打造可靠的Web应用
  • 『大模型笔记』基于LLM生成真实世界数据的合成问答数据!
  • 一个使用Python和`scikit-learn`库实现KMeans聚类算法的简单示例
  • 记录一下vue2和vue3中如何配置keep-alive及写法上的差异
  • 面试题:Rabbitmq怎么保证消息的可靠性?
  • 性能测试工具之JMeter
  • SQL Zoo 9-.Window functions
  • 智能化清理C盘的方法 小白也可以轻松清理C盘了 不再担心误删文件
  • 在c#中常用的特性
  • Polars简明基础教程十二:可视化(二)
  • python 使用正则表达式判断图片路径是否是超链接
  • 【学习笔记】Day 14
  • 使用SSL认证访问操作手册