当前位置：首页 > news >正文

语音合成(自然、非自然)

news 2025/7/22 12:41:41

1.环境

Python 3.10.14

2.完成代码

2.1简陋版


import pyttsx3# 初始化tts引擎
engine = pyttsx3.init()# 设置语音速度
rate = engine.getProperty('rate')
engine.setProperty('rate', rate - 50)# 设置语音音量
volume = engine.getProperty('volume')
engine.setProperty('volume', volume + 0.5)if __name__ == '__main__':engine.say("我的包子很好吃，你想吃吗")engine.runAndWait()engine.stop()

2.2惊艳版(目前仅支持在Linux操作系统上使用，暂不支持Windows及Mac使用)

text = '待合成文本'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:f.write(wav)

3.效果

传不了语音，语音效果还是蛮不错的
在这里插入图片描述

4.问题

1.在Linux上运行的效果很好，普通的能跑的版本效果不行
2.模型可去模型资源网站搜索下载(也可私信)

http://www.lryc.cn/news/444392.html

相关文章：

redis简单使用与安装

封装 WBXpopup 组件

【OJ刷题】双指针问题6

详解：Tensorflow、Pytorch、Keras（搭建自己的深度学习网络）

【CSS in Depth 2 精译_035】5.5 Grid 网格布局中的子网格布局（全新内容）

Java是怎么处理死锁的

Effective Java 学习笔记方法签名设计

毛利超70%、超70＋智驾客户，这家AI数据训练服务商刚刚止亏

本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌

图像压缩编码（4）--H.26x系列视频压缩编码_2

JS渲染锻炼输入表单

proteus仿真学习（1）

决策树+随机森林模型实现足球大小球让球预测软件

31省市农业地图大数据

http请求包含什么

【基础算法总结】模拟篇

《深度学习》PyTorch 手写数字识别案例解析及实现＜下＞

【笔记】材料分析测试：晶体学

飞塔Fortigate7.4.4的DNS劫持功能

Unity 设计模式之行为型模式 -【状态模式】【观察者模式】【备忘录模式】

【RabbitMQ】RabbitMQ 的概念以及使用RabbitMQ编写生产者消费者代码

openmv与stm32通信

C++ STL全面解析：六大核心组件之一----序列式容器（vector和List）（STL进阶学习）

【c数据结构】OJ练习篇帮你更深层次理解链表！（相交链表、相交链表、环形链表、环形链表之寻找环形入口点、判断链表是否是回文结构、随机链表的复制）

微软开源GraphRAG的使用教程（最全，非常详细）

使用Refine构建项目（1）初始化项目

【Docker】安装及使用

[大语言模型-论文精读] 以《黑神话：悟空》为研究案例探讨VLMs能否玩动作角色扮演游戏？

提升动态数据查询效率：应对数据库成为性能瓶颈的优化方案

Prometheus+grafana+kafka_exporter监控kafka运行情况