当前位置: 首页 > news >正文

Unity 语音转文字 Vosk 离线库

市场有很多语音库,这里介绍Vosk SDK 

除了支持untiy外还有原生开发服务器等

目录

  1. 安装unity示例demo
  2. 下载语音训练文件
  3. 运行demo
  4. 结尾
  5. 一键三联

注意事项

  1. 有可能debug出来的文本是空的,(确保麦克风正常,且索引正确)
  2. 分大模型和小模型,小模型给移动端用,大模型给pc端用,小模型识别速度快,但大模型准

安装unity示例demo

自己clone库,unity版本我选的2022.3.42f1c1

https://github.com/alphacep/vosk-unity-asr

下载语音训练文件

小模型42M

https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip

大模型1.3G

https://alphacephei.com/vosk/models/vosk-model-cn-0.22.zip

注意要是下载网速慢,可使用梯子

下载完毕后,将文件copy到工程的StreamingAssets

运行Demo

设置麦克风索引

这里我打印了麦克风信息列表

识别结果已经在Log上了

结尾

有一定的错误率,但只要你说普通话,吐字清晰,基本上很准

这里是根据麦克风实时输入并转成文本。

理论上也可以把MP3 wav等转成文本

或者根据自己的业务需求,做出点击麦克风开始录制,点击结束,再进行识别

  一键三联

点赞·留言·收藏

如果可以帮到你,好用的话,记得一键三连。

毕竟博主写文章是靠爱发电,所以爱会消失对不对

http://www.lryc.cn/news/521902.html

相关文章:

  • VSCode连接Github的重重困难及解决方案!
  • 《AI赋能鸿蒙Next,打造极致沉浸感游戏》
  • 小白:react antd 搭建框架关于 RangePicker DatePicker 时间组件使用记录 2
  • <C++学习>C++ std 多线程教程
  • 用 Python 自动化处理日常任务
  • 《深入浅出HTTPS​​​​​​​​​​​​​​​​​》读书笔记(28):DSA数字签名
  • type 属性的用途和实现方式(图标,表单,数据可视化,自定义组件)
  • PSINS工具箱学习(四)捷联惯导更新算法
  • P1Linux和Docker常用终端命令:保姆级图文详解
  • Windows重装后NI板卡LabVIEW恢复正常
  • 深度解析统计学四大分布:Z、卡方、t 与 F 的关联与应用
  • zkServer.sh脚本
  • CV(10)--目标检测
  • UML系列之Rational Rose笔记七:状态图
  • C++单例模式的设计
  • 基于springboot的自习室预订系统
  • shell笔记
  • 《鸿蒙Next微内核:解锁人工智能决策树并行计算的加速密码》
  • AI刷题-最大矩形面积问题、小M的数组变换
  • Redis集群部署详解:主从复制、Sentinel哨兵模式与Cluster集群的工作原理与配置
  • LeetCode热题100(三十四) —— 23.合并K个升序链表
  • kalilinux - 目录扫描之dirsearch
  • 浅谈云计算04 | 云基础设施机制
  • 文件上传 分片上传
  • 【0391】Postgres内核 checkpointer process ① 启动初始化
  • 链路追踪SkyWalking
  • Uniapp判断设备是安卓还是 iOS,并调用不同的方法
  • 计算机网络 (42)远程终端协议TELNET
  • rtthread学习笔记系列-- 23 环形缓冲块 ringblock
  • HunyuanVideo 文生视频模型实践