当前位置：首页 > news >正文

python 语音识别方案对比

news 2025/9/15 10:48:39

目录

一、语音识别

二、代码实践

2.1 使用vosk三方库

2.2 使用SpeechRecognition

2.3 使用Whisper

一、语音识别

今天识别了别人做的这个app，觉得虽然是个日记app 但是用来学英语也挺好的，能进行语音识别，然后矫正语法，自己说的时候，实在不知道怎么说可以先乱说，然后后续矫正，在把这个不会的点学起来。然后我就研究了下语音识别的技术方案。

语音识别（Speech Recognition）是一种将人类语音转换为可理解的文本或指令的技术。它的核心原理是通过对声音信号进行捕捉、特征提取和模式匹配，将语音信号映射到相应的文字或指令上。常见的语音识别应用包括：

语音助手：如苹果的Siri、谷歌助手、小度等，可根据语音指令执行任务，回答问题。
智能家居控制：通过语音

http://www.lryc.cn/news/533435.html

相关文章：

docker常用命令及案例

DeepSeek-R1 云环境搭建部署流程

Java_双列集合

.net的一些知识点6

无须付费，安装即是完全版！

常见数据库对象与视图VIEW

【Vue2】vue2项目中如何使用mavon-editor编辑器，数据如何回显到网页，如何回显到编辑器二次编辑

2、Python面试题解析：如何进行字符串插值？

计算机网络-SSH基本原理

doris:MySQL 兼容性

mysql 存储过程和自定义函数详解

C++ 中的 cJSON 解析库：用法、实现及递归解析算法与内存高效管理

websocket自动重连封装

【C语言】球球大作战游戏

人工智能D* Lite 算法-动态障碍物处理、多步预测和启发式函数优化

MySQL 8版本认证问题

Android 开发APP中参数配置与读取总结

Scala 语法入门

python中的flask框架

【redis】缓存设计规范

归一化与伪彩：LabVIEW图像处理的区别

DeepSeek大模型本地部署实战

deepseek+kimi自动生成ppt

集成SwanLab与HuggingFace TRL：跟踪与优化强化学习实验

cefsharp131升级132测试（WinForms.NETCore）

Gitee AI上线：开启免费DeepSeek模型新时代

nginx常用命令及补充

自动驾驶---聊聊传统规控和端到端

node.js + html + Sealos容器云搭建简易多人实时聊天室demo 带源码

OpenFeign远程调用返回的是List＜T＞类型的数据