当前位置: 首页 > news >正文

文字语音相互转换

目录

1.介绍

2.思路

3.安装python包

3.程序:

4.运行结果


1.介绍

当我们使用一些本地部署的语言模型的时候,往往只能进行文字对话,这一片博客教大家如何实现语音转文字和文字转语音,之后接入ollama的模型就能进行语音对话了。

2.思路

使用离线本地语音:pyttsx3实现文字转语言,然后使用whisper实现语音转文字

3.安装python包

pip install pyttsx3pip install whisper
  • 文字转语音 (TTS)
    • 使用 pyttsx3 将输入文本转换为音频文件 output.wav
    • pyttsx3 生成的语音文件是本地生成的,不依赖于网络。
  • 语音转文字 (STT)
    • 使用 Whisper 模型将 output.wav 文件中的语音转录为文字。
    • Whisper 通过 PyTorch 在本地运行,不需要外部网络访问。

3.程序:

import pyttsx3
import whisper
import os# 文字转语音(TTS)部分
def text_to_speech(text, output_file="语音文字相互转换/output.wav"):# 初始化 pyttsx3 引擎engine = pyttsx3.init()# 设置语速和音量engine.setProperty('rate', 150)    # 语速engine.setProperty('volume', 1.0)  # 音量# 将文本保存为音频文件engine.save_to_file(text, output_file)# 运行并生成语音文件engine.runAndWait()print(f"Text-to-Speech conversion complete! Audio saved as '{output_file}'.")# 语音转文字(STT)部分
def speech_to_text(input_file):# 加载 Whisper 模型model = whisper.load_model("base")# 转录音频文件result = model.transcribe(input_file)# 打印转录的文本print("Transcribed Text:", result["text"])# 主函数
if __name__ == "__main__":# 1. 输入文本text = "hello,today is a good day!"# 2. 文字转语音text_to_speech(text, output_file="语音文字相互转换/output.wav")# 3. 语音转文字speech_to_text("语音文字相互转换/output.wav")

4.运行结果

http://www.lryc.cn/news/542223.html

相关文章:

  • DeepSeek-R1:通过强化学习激发大语言模型的推理能力
  • MATLAB中fft函数用法
  • 【SpringBoot】【JWT】使用JWT的claims()方法存入Integer类型数据自动转为Double类型
  • Crack SmartGit
  • 【备赛】在keil5里面创建新文件的方法+添加lcd驱动
  • Rk3568驱动开发_驱动实现流程以及本质_3
  • 【学习笔记】LLM+RL
  • 深入理解IP子网掩码子网划分{作用} 以及 不同网段之间的ping的原理 以及子网掩码的区域划分
  • rust 前端npm依赖工具rsup升级日志
  • 2.2 STM32F103C8T6最小系统板的四种有关固件的开发方式
  • 【C++】 stack和queue以及模拟实现
  • python与C系列语言的差异总结(2)
  • Linux之文件系统
  • LeetCode刷题 -- 23. 合并 K 个升序链表
  • DeepSeek在MATLAB上的部署与应用
  • mapbox基础,使用geojson加载fill-extrusion三维填充图层
  • 基于 SpringBoot 的 “电影交流平台小程序” 系统的设计与实现
  • 单片机裸机编程-时机管理
  • Flutter系列教程之(2)——Dart语言快速入门
  • pyecharts介绍
  • 前缀和相关题目记录(未完待续...)
  • Https解决了Http的哪些问题
  • OpenCV给图像添加噪声
  • 湖北中医药大学谱度众合(武汉)生命科技有限公司研究生工作站揭牌
  • 欢乐力扣:快乐数
  • 【聊天室后端服务器开发】功能设计-框架与微服务
  • 国标28181协议在智联视频超融合平台中的接入方法
  • 让网页“浪“起来:打造会呼吸的波浪背景
  • linux-多进程基础(1) 程序、进程、多道程序、并发与并行、进程相关命令,fork
  • 美颜相机1.0