当前位置：首页 > news >正文

python 语音识别

news 2025/7/4 21:54:08

目录

一、语音识别

二、代码实践

2.1 使用vosk三方库

2.2 使用SpeechRecognition

2.3 使用Whisper

一、语音识别

今天识别了别人做的这个app，觉得虽然是个日记app 但是用来学英语也挺好的，能进行语音识别，然后矫正语法，自己说的时候，实在不知道怎么说可以先乱说，然后后续矫正，在把这个不会的点学起来。然后我就研究了下语音识别的技术方案。

语音识别（Speech Recognition）是一种将人类语音转换为可理解的文本或指令的技术。它的核心原理是通过对声音信号进行捕捉、特征提取和模式匹配，将语音信号映射到相应的文字或指令上。常见的语音识别应用包括：

语音助手：如苹果的Siri、谷歌助手、小度等，可根据语音指令执行任务，回答问题。
智能家居控制：通过语音

http://www.lryc.cn/news/531703.html

相关文章：

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答：包括671B满血版和各个蒸馏版的部署

[mmdetection]fast-rcnn模型训练自己的数据集的详细教程

1. Kubernetes组成及常用命令

linux下ollama更换模型路径

本地Ollama部署DeepSeek R1模型接入Word

【自学笔记】Git的重点知识点-持续更新

[EAI-028] Diffusion-VLA，能够进行多模态推理和机器人动作预测的VLA模型

实现数组的扁平化

登录认证（5）：过滤器：Filter

pytorch实现门控循环单元 (GRU）

机器学习常用包numpy篇（四）函数运算

TCP 丢包恢复策略：代价权衡与优化迷局

面经--C语言——内存泄漏、malloc和new的区别 .c文件怎么转换为可执行程序 uart和usart的区别继承的访问权限总结

Denavit-Hartenberg DH MDH坐标系

力扣动态规划-20【算法学习day.114】

计算机视觉-边缘检测

文字加持：让 OpenCV 轻松在图像中插上文字

掌握 HTML5 多媒体标签：如何在所有浏览器中顺利嵌入视频与音频

在Mac mini M4上部署DeepSeek R1本地大模型

【电脑系统】电脑突然（蓝屏）卡死发出刺耳声音

Docker使用指南（二）——容器相关操作详解（实战案例教学，创建/使用/停止/删除）

Java中的常见对象类型解析

Dijkstra算法解析

C++ Primer 多维数组

maven mysql jdk nvm node npm 环境安装

SQL Server中RANK()函数：处理并列排名与自然跳号

如何运行Composer安装PHP包安装JWT库

最新功能发布！AllData数据中台核心菜单汇总