当前位置: 首页 > news >正文

kaldi 详细安装教程、PyTorch-Kaldi、TIMIT下载、Librispeech下载

kaldi 详细安装教程

本kaldi 安装教程 转载于该链接kaldi 详细安装教程

安装系统依赖(如果经常使用linux 服务器,一般都会有)

apt-get updateapt-get install -y --no-install-recommends g++ make automake autoconf bzip2 unzip wget sox libtool git subersion python2.7 python3 zlib1g-dev gfortran ca-certificates patch vim
# 或
apt-get install -y  g++ make automake autoconf bzip2 unzip wget sox libtool git subersion python2.7 python3 zlib1g-dev gfortran ca-certificates patch vimrm -rf /var/lib/apt/lists/*ln -s /usr/bin/python2.7 /usr/bin/python

安装kaldi
首先先从github上直接克隆kaldi的仓库下来,网不好的话建议下载最新的压缩包然后直接解压。

git clone https://github.com/kaldi-asr/kaldi.git

检查依赖是否安装完成:

cd <kaldi-path>/tools
extras/check_dependencies.sh

这里它提示缺什么就再安装一遍。
然后自行下面的命令安装Intel MKL

extras/install_mkl.sh

不出意外的话这里应该是提示安装成功

使用以下命令检查依赖,

extras/check_dependencies.sh

如果提示
extras/check_dependencies.sh: all OK.
那依赖就没问题了。
之后运行

make -j 12
# 这里的12指的是cpu核心数,看自己的cpu设置,当然越多越快。

注意,此次也许不会提示任何错误,但是事实上有一些东西并没有安装成功,使用ls -lh 查看make过程中下载的4个***.tar.gz的大小,如果发现是0kb估计没下载成功,手动下载然后移动到当前目录下,然后使用make clean清空一下缓存就可以了重新make了。

编译Kaldi代码

# Config src before compiling
cd <kaldi-path>/src
./configure --shared 
# 我执行./configure --shared --use-cuda的时候提醒
# 我没有--use-cuda这个参数,我很奇怪,看了一下文件是有这个参数的,
# 但是默认为yes,所以这里不加--use-cuda应该也是行的通。# Check depend and compile
make depend -j 12
make -j 12

当你经过上面漫长的make都没有出过任何错误时,那么恭喜你,你的kaldi大概率是安装完成了。

测试kaldi
运行yesno的例子,验证安装是否成功

cd <kaldi-path>/egs/yesno/s5./run.sh
# 或 bash ./run.sh

如果完美运行就代表你以及成功安装完kaldi了!!!

PyTorch-Kaldi安装

安装PyTorch-Kaldi 官方的github上其实已经交代的很清楚了https://github.com/mravanelli/pytorch-kaldi
注意:Prerequisites
在安装PyTorch-Kaldi之前,安装Kaldi是预备条件,正如上面的部分,并且需要完成如下设置:

  • 打开终端,并输入以下命令来编辑 .bashrc 文件
nano ~/.bashrc
  • 在文件末尾添加以下内容
export KALDI_ROOT=/home/mirco/kaldi-trunk # 注意这里是你装kaldi的目录
PATH=$PATH:$KALDI_ROOT/tools/openfst
PATH=$PATH:$KALDI_ROOT/src/featbin
PATH=$PATH:$KALDI_ROOT/src/gmmbin
PATH=$PATH:$KALDI_ROOT/src/bin
PATH=$PATH:$KALDI_ROOT/src/nnetbin
export PATH
  • 保存并退出:
    在 nano 编辑器中,按下 Ctrl + X 键来退出。
    当提示是否保存更改时,按下 Y 键。
    然后按下 Enter 键确认保存更改。

  • 更新 .bashrc 文件:
    在终端中输入以下命令,使更改生效:

source ~/.bashrc

TIMIT下载

TIMIT 的官方下载链接是:https://catalog.ldc.upenn.edu/LDC93S1
对于学术工作来说,可以在https://academictorrents.com/免费下载
注意在https://academictorrents.com/下载时,需要下载Transmission torrent client
具体可以看 https://academictorrents.com/docs/downloading.html

Librispeech下载

Librispeech的下载非常简单:
https://www.openslr.org/12

语音处理相关的数据集下载

开源语音数据集

http://www.lryc.cn/news/306324.html

相关文章:

  • EtherCAT 转 ModbusTCP 网关
  • iMazing2024Windows和Mac的iOS设备管理软件(可以替代iTunes进行数据备份和管理)
  • carpower
  • 数据结构2月25日
  • 改进 RAG:自查询检索
  • 【Git企业实战开发】Git常用开发流操作总结
  • vue2+element医院安全(不良)事件报告管理系统源代码
  • leetcode初级算法(python)- 字符串
  • Python 鼠标模拟
  • Linux进程 ----- 信号处理
  • 【数位】【数论】【分类讨论】2999. 统计强大整数的数目
  • MongoDB聚合运算符:$atan2
  • 敏捷开发最佳实践:价值维度实践案例之ABTest中台化
  • 爬虫基本库的使用(requests库的详细解析)
  • QT实现串口通信
  • 微信小程序 --- 通用模块封装(showToast,showModal ,本地存储)
  • 基于springboot+vue的音乐网站(前后端分离)
  • pclpy 最小二乘法拟合平面
  • 蓝桥杯备战刷题(自用)
  • Python习题详解
  • 绩效考核利器:Excel报表模板,解锁企业高效员工评价新境界
  • 如何使用Lychee+cpolar搭建本地私人图床并实现远程访问存储图片
  • 跨境支付介绍
  • 如何在Linux搭建MinIO服务并实现无公网ip远程访问内网管理界面
  • Cortex-M可以跑Linux操作系统吗?
  • 日志系统项目(2)项目实现(实用工具类、日志等级类、日志消息类、日志格式化输出类)
  • 剑指offer面试题19 二叉树的镜像
  • SpringCloud Alibaba 2022之Nacos学习
  • js之数组遍历
  • 极狐GitLab 16.9 重磅发布,快来 pick 你心仪的功能吧~【五】