当前位置: 首页 > news >正文

sherpa-onnx说话人识别+语音识别自动开启(VAD)+语音识别Python API

专栏总目录

        获取该开源项目的渠道,是我在b站上,看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供,感谢分享!

新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API_哔哩哔哩_bilibili

开源项目地址:GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recognition using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, C/C++, Python, Kotlin, C#, Go, NodeJS, Java, Swift, Dart, JavaScript

文档地址:sherpa-onnx — sherpa 1.3 documentation

        我之前已经使用了sherpa-ncnn和安装了kaldi,所以有些需要安装依赖的情况,跟大家会有不同。相关依赖安装情况,可以参考使用sherpa-ncnn进行中文语音识别(ubuntu22)-CSDN博客和详细解析Ubuntu22 部署Kaldi大模型_kaldi布署-CSDN博客两篇文章。

一、安装sherpa-onnx模型

        文档中介绍了多种语言及环境的使用方法,这里只针对python开发包的安装使用进行测试。

(一)下载模型脚本文件

从开源项目地址下载文件:GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recogni

http://www.lryc.cn/news/376264.html

相关文章:

  • 提取人脸——OpenCV
  • python数据可视化:在图形中添加注释matplotlib.pyplot.annotate()
  • IDEA debug 调试Evaluate Expression应用
  • 04-echarts-立体柱状图扩展
  • HTML5 Web Workers: 异步编程的强大力量
  • Flutter第十二弹 Flutter多平台运行
  • 30天学会QT---------------大项目之在线考试系统
  • 搜维尔科技:力反馈主手—手术机器人应用〈腔镜手术机器人平台—进入手术室动物实验〉
  • 缓存技术实战[一文讲透!](Redis、Ecache等常用缓存原理介绍及实战)
  • 初识es(elasticsearch)
  • AI在线免费视频工具2:视频配声音
  • Kafka 如何保证消息顺序及其实现示例
  • 内存分配器性能优化
  • 《OKR工作法》读书笔记
  • 2025年计算机毕业设计题目参考-简单容易
  • 3.8. 马氏链-一般状态空间的马氏链(Harris链)
  • Python8 使用结巴(jieba)分词并展示词云
  • python中scrapy
  • 基础语法总结 —— Python篇
  • 数据库系统概述选择简答概念复习
  • template标签
  • WPF 程序 分布式 自动更新 登录 打包
  • 视频汇聚安防综合管理平台EasyCVR支持GA/T 1400视图库标准及设备接入配置
  • pgsql给单独数据库制定账号权限
  • 【Docker安装】Ubuntu系统下部署Docker环境
  • Flink Kafka获取数据写入到MongoDB中 样例
  • Android Jetpack Compose入门教程(二)
  • 如何避免接口重复请求(axios推荐使用AbortController)
  • 算法设计与分析:网络流求解棒球赛淘汰问题C++
  • Linux Ubuntu 24.04 C语言gcc编译过程详解