当前位置：首页 > news >正文

Unity 语音转文字 Vosk 离线库

news 2025/7/5 1:35:25

市场有很多语音库，这里介绍Vosk SDK

除了支持untiy外还有原生开发服务器等

注意事项

有可能debug出来的文本是空的，（确保麦克风正常，且索引正确）
分大模型和小模型，小模型给移动端用，大模型给pc端用，小模型识别速度快，但大模型准

安装unity示例demo

自己clone库，unity版本我选的2022.3.42f1c1

https://github.com/alphacep/vosk-unity-asr

下载语音训练文件

小模型42M

https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip

大模型1.3G

https://alphacephei.com/vosk/models/vosk-model-cn-0.22.zip

注意要是下载网速慢，可使用梯子

下载完毕后，将文件copy到工程的StreamingAssets

运行Demo

设置麦克风索引

这里我打印了麦克风信息列表

识别结果已经在Log上了

结尾

有一定的错误率，但只要你说普通话，吐字清晰，基本上很准

这里是根据麦克风实时输入并转成文本。

理论上也可以把MP3 wav等转成文本

或者根据自己的业务需求，做出点击麦克风开始录制，点击结束，再进行识别

一键三联

点赞·留言·收藏

如果可以帮到你，好用的话，记得一键三连。

毕竟博主写文章是靠爱发电，所以爱会消失对不对。

查看全文

http://www.lryc.cn/news/521902.html

VSCode连接Github的重重困难及解决方案！

《AI赋能鸿蒙Next，打造极致沉浸感游戏》

小白：react antd 搭建框架关于 RangePicker DatePicker 时间组件使用记录 2

＜C++学习＞C++ std 多线程教程

用 Python 自动化处理日常任务

《深入浅出HTTPS》读书笔记（28）：DSA数字签名

type 属性的用途和实现方式（图标，表单，数据可视化，自定义组件）

PSINS工具箱学习（四）捷联惯导更新算法

P1Linux和Docker常用终端命令：保姆级图文详解

Windows重装后NI板卡LabVIEW恢复正常

深度解析统计学四大分布：Z、卡方、t 与 F 的关联与应用

zkServer.sh脚本

CV(10)--目标检测

UML系列之Rational Rose笔记七：状态图

C++单例模式的设计

基于springboot的自习室预订系统

shell笔记

《鸿蒙Next微内核：解锁人工智能决策树并行计算的加速密码》

AI刷题-最大矩形面积问题、小M的数组变换

Redis集群部署详解：主从复制、Sentinel哨兵模式与Cluster集群的工作原理与配置

LeetCode热题100（三十四） —— 23.合并K个升序链表

kalilinux - 目录扫描之dirsearch

浅谈云计算04 | 云基础设施机制

文件上传分片上传

【0391】Postgres内核 checkpointer process ① 启动初始化

链路追踪SkyWalking

Uniapp判断设备是安卓还是 iOS，并调用不同的方法

计算机网络（42）远程终端协议TELNET

rtthread学习笔记系列-- 23 环形缓冲块 ringblock

HunyuanVideo 文生视频模型实践

目录

注意事项

安装unity示例demo

下载语音训练文件

运行Demo

结尾

一键三联

相关文章：