当前位置: 首页 > news >正文

语音合成(自然、非自然)

1.环境

Python 3.10.14

2.完成代码

2.1简陋版


import pyttsx3# 初始化tts引擎
engine = pyttsx3.init()# 设置语音速度
rate = engine.getProperty('rate')
engine.setProperty('rate', rate - 50)# 设置语音音量
volume = engine.getProperty('volume')
engine.setProperty('volume', volume + 0.5)if __name__ == '__main__':engine.say("我的包子很好吃,你想吃吗")engine.runAndWait()engine.stop()

2.2惊艳版(目前仅支持在Linux操作系统上使用,暂不支持Windows及Mac使用)

text = '待合成文本'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:f.write(wav)

3.效果

传不了语音,语音效果还是蛮不错的
在这里插入图片描述

4.问题

1.在Linux上运行的效果很好,普通的能跑的版本效果不行
2.模型可去模型资源网站搜索下载(也可私信)

http://www.lryc.cn/news/444392.html

相关文章:

  • redis简单使用与安装
  • 封装 WBXpopup 组件
  • 【OJ刷题】双指针问题6
  • 详解:Tensorflow、Pytorch、Keras(搭建自己的深度学习网络)
  • 【CSS in Depth 2 精译_035】5.5 Grid 网格布局中的子网格布局(全新内容)
  • Java是怎么处理死锁的
  • Effective Java 学习笔记 方法签名设计
  • 毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
  • 本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌
  • 图像压缩编码(4)--H.26x系列视频压缩编码_2
  • JS渲染锻炼输入表单
  • proteus仿真学习(1)
  • 决策树+随机森林模型实现足球大小球让球预测软件
  • 31省市农业地图大数据
  • http请求包含什么
  • 【基础算法总结】模拟篇
  • 《深度学习》PyTorch 手写数字识别 案例解析及实现 <下>
  • 【笔记】材料分析测试:晶体学
  • 飞塔Fortigate7.4.4的DNS劫持功能
  • Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】
  • 【RabbitMQ】RabbitMQ 的概念以及使用RabbitMQ编写生产者消费者代码
  • openmv与stm32通信
  • C++ STL全面解析:六大核心组件之一----序列式容器(vector和List)(STL进阶学习)
  • 【c数据结构】OJ练习篇 帮你更深层次理解链表!(相交链表、相交链表、环形链表、环形链表之寻找环形入口点、判断链表是否是回文结构、 随机链表的复制)
  • 微软开源GraphRAG的使用教程(最全,非常详细)
  • 使用Refine构建项目(1)初始化项目
  • 【Docker】安装及使用
  • [大语言模型-论文精读] 以《黑神话:悟空》为研究案例探讨VLMs能否玩动作角色扮演游戏?
  • 提升动态数据查询效率:应对数据库成为性能瓶颈的优化方案
  • Prometheus+grafana+kafka_exporter监控kafka运行情况