当前位置：首页 > news >正文

sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

news 2025/7/17 9:57:56

专栏总目录

获取该开源项目的渠道，是我在b站上，看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供，感谢分享！

新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API_哔哩哔哩_bilibili

开源项目地址：GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recognition using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, C/C++, Python, Kotlin, C#, Go, NodeJS, Java, Swift, Dart, JavaScript

文档地址：sherpa-onnx — sherpa 1.3 documentation

我之前已经使用了sherpa-ncnn和安装了kaldi，所以有些需要安装依赖的情况，跟大家会有不同。相关依赖安装情况，可以参考使用sherpa-ncnn进行中文语音识别（ubuntu22）-CSDN博客和详细解析Ubuntu22 部署Kaldi大模型_kaldi布署-CSDN博客两篇文章。

一、安装sherpa-onnx模型

文档中介绍了多种语言及环境的使用方法，这里只针对python开发包的安装使用进行测试。

（一）下载模型脚本文件

从开源项目地址下载文件：GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recogni

http://www.lryc.cn/news/376264.html

相关文章：

提取人脸——OpenCV

python数据可视化：在图形中添加注释matplotlib.pyplot.annotate()

IDEA debug 调试Evaluate Expression应用

04-echarts-立体柱状图扩展

HTML5 Web Workers: 异步编程的强大力量

Flutter第十二弹 Flutter多平台运行

30天学会QT---------------大项目之在线考试系统

搜维尔科技：力反馈主手—手术机器人应用〈腔镜手术机器人平台—进入手术室动物实验〉

缓存技术实战[一文讲透!](Redis、Ecache等常用缓存原理介绍及实战)

初识es（elasticsearch）

AI在线免费视频工具2：视频配声音

Kafka 如何保证消息顺序及其实现示例

内存分配器性能优化

《OKR工作法》读书笔记

2025年计算机毕业设计题目参考-简单容易

3.8. 马氏链-一般状态空间的马氏链(Harris链)

Python8 使用结巴（jieba）分词并展示词云

python中scrapy

基础语法总结 —— Python篇

数据库系统概述选择简答概念复习

WPF 程序分布式自动更新登录打包

视频汇聚安防综合管理平台EasyCVR支持GA/T 1400视图库标准及设备接入配置

pgsql给单独数据库制定账号权限

【Docker安装】Ubuntu系统下部署Docker环境

Flink Kafka获取数据写入到MongoDB中样例

Android Jetpack Compose入门教程（二）

如何避免接口重复请求(axios推荐使用AbortController)

算法设计与分析：网络流求解棒球赛淘汰问题C++

Linux Ubuntu 24.04 C语言gcc编译过程详解