机器学习案例1:利用 Python 将语音转换为文本
目录
内容简介
基本环境配置
Python库安装
麦克风语音识别
音频文件的语音识别
长音频源语音识别
内容简介
语音识别是机器或程序识别口语中的单词和短语并将其转换为文本信息的能力。
大多数对于语音识别技术的应用场景就是Siri、Cortana和Google Assistant等个人助理,以及其他通过语音交互的虚拟助理。为了理解你的声音,这些虚拟助手需要进行语音识别。
语音识别是一个复杂的过程,因此我不会教您如何训练机器学习/深度学习模型来做到这一点。相反,我将指导您如何使用谷歌语音识别 API 来完成此操作。快速高效的实现语音识别目的的同时,避免重复造轮子带来的资源浪费。
只要您具备 Python 基础知识,您就可以成功完成本教程并使用 Python构建您自己的功能齐全的语音识别程序。