当前位置: 首页 > news >正文

参考mfa官方文档实践笔记(亲测)

  1. 按顺序执行以下指令:
    conda create -n aligner -c conda-forge montreal-forced-alignerconda config --add channels conda-forgeconda activate alignerconda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia 
  2. 如果报错:
    Solving environment: failed with initial frozen solve. Retrying with flexible solve.

    替换为pip 执行指令:

    pip3 install torch torchvision torchaudio -i  https://pypi.tuna.tsinghua.edu.cn/simple
  3. 接着执行以下指令:
    pip install speechbrain -i  https://pypi.tuna.tsinghua.edu.cn/simple conda update --all pip uninstall montreal-forced-aligner conda install -c conda-forge montreal-forced-aligner
  4. 对于英文:
    1. 执行以下指令:
      mfa model download acoustic english_us_arpamfa model download dictionary english_us_arpa mfa model inspect acoustic english_us_arpa  // 可以看到声学模型的一些特性mfa validate corpus_dir_path english_us_arpa english_us_arpa
    2. 如果报错:
      initdb: error: cannot be run as root
      initdb: hint: Please log in (using, e.g., "su") as the (unprivileged) user that will own the server process.
      1. 原因:不可以在root权限下操作

      2. 解决:切换到普通用户就可以执行了

      3. 如果语料库发生了变化,mfa validate 指令加上--clean

    3. 执行对齐指令:
      mfa align corpus_dir_path english_us_arpa english_us_arpa align_result_dir_path
    4. 如果报错:
      sqlalchemy.exc.OperationalError: (psycopg2.OperationalError) server closed the connection unexpectedly
      This probably means the server terminated abnormally
      before or while processing the request.

      1. 解决:网络问题,再重复执行即可
      2. 注意corpus目录下wav和转录文件需要名字是对应的。
  5. 对于中文
    1. 由于官网给的词典好像用不了,这里(跳转中...,提取码:mma3)提供了准备的词典和声学模型,下载即可
    2. 执行以下指令:
      mfa validate corpus_dir_root dictionary_path acoustic_modle_pathmfa align corpus_dir_root dictionary_path acoustic_modle_path alignment_result_dir
http://www.lryc.cn/news/44743.html

相关文章:

  • 【 第六章 拦截器,注解配置springMVC,springMVC执行流程】
  • 一种编译器视角下的python性能优化
  • 太逼真!这个韩国虚拟女团你追不追?
  • 安全与道路测试:自动驾驶系统安全性探究
  • chatGPT学英语,真香!!!
  • 12 Cache Memory
  • 【CSS系列】第一章 · CSS基础
  • 【Java代码审计】表达式注入
  • Python-GEE遥感云大数据分析、管理与可视化
  • 信息学奥赛一本通 1375:骑马修栅栏(fence) | 洛谷 P2731 [USACO3.3]骑马修栅栏 Riding the Fences
  • Spring Boot 应用的打包和发布
  • linux:iptables (3) 命令行操练(一)
  • synchronized(this) 与synchronized(class) 有啥区别
  • BOSS直拒、失联招聘,消失的“金三银四”,失业的测试人出路在哪里?
  • 华为OD机试【密室逃生游戏】
  • 【Python学习笔记(六)】json解析模块的使用
  • 《Spring系列》第3章 基于注解管理Bean
  • 【Redis】十大数据类型(下篇)
  • 【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”
  • Python入门到高级【第一章】
  • 【泰凌微TLSR8258 zigbee】OTA升级操作方法
  • 网络基础设施监控
  • OPNET Modeler 例程——创建一个包交换网络
  • JSON 基础结构
  • 雷达基础知识
  • 【二阶锥规划】考虑气电联合需求响应的气电综合能源配网系统协调优化运行【IEEE33节点】(Matlab代码实现)
  • qt 编译器 调试器
  • 低代码平台助力AIGC:让人工智能技术更加普及和高效
  • Qt中Model/View结构
  • 中纬ZOOM35全站仪参数和使用说明书