当前位置: 首页 > news >正文

AI克隆语音(基于GPT-SoVITS)

概述

使用GPT-SoVITS训练声音模型,实现文本转语音功能。可以模拟出语气,语速。如果数据质量足够高,可以达到非常相似的结果。相比于So-VITS-SVC需要的显卡配置更低,数据集更小(我的笔记本NVIDIA GeForce RTX 4050 Laptop GPU跑起来毫无压力。)

使用

GPT-SoVITS项目地址(https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)
项目集成了干声提取工具,声音剪切工具,语音文本校对工具等工具,你只需要一段高质量的语音即可在本地克隆声音。

下载项目

下载项目到本地,解压并打开,双击go-webui.bat,会打开控制台,稍等片刻会打开浏览器
image.png

image.png
有两个标签页(前两个,第三个还没做好),一个是数据处理,得到干声数据集和语音文本。
一个是模型训练和推理。
数据处理所有参数都默认,只需要选择对应的数据文件路径即可。

数据处理

输入文件路径为绝对路径,输出的文件路径默认在该项目文件夹目录下。数据处理目标是得到一个语音文本文件和一个声音数据集。

分离干声

image.png
这一步用于分离干声,选中该选项稍等一会会打开一个网页用于分离干声,输出格式选择wav。选择输入输出目录点击转换即可。

image.png

音频切分

image.png

语音降噪

如果是自己的录音可能会有噪音需要降噪处理,如果是网上下载的歌曲干声不用进行该操作。
image.png

语音文本识别

识别处理好的声音数据,并得到对应的文本文件。
image.png

语音文本校对

注意输入路径是文件的路径,不是文件夹的路径。选中后会打开一个页面用于校对语音文本。
image.png

image.png
有些识别的字可能有问题,需要手动去修改一下,以及一些停顿处需要增加或删除标点符号。修改后需要点击Submit Text保存。

训练和推理

训练集格式化

填写三个打星号的文本框即可,其他不用管。然后点击最下方的开启一键三连,等待完成之后就可以进行训练。
image.png
image.png

模型训练

image.png
batch_size:计算一次更新梯度的样本数量,影响训练速度。
total_epoch:训练轮次,影响模型质量,理论上来说越大越好。
GPT模型对结果影响不大,训练个10-15轮即可。SoVITS可以多训练一些。
其他保持默认即可。

推理

image.png
刷新一下模型路径,选择训练好的模型。选择数字最大的即可。选中开启TTS推理页面。
image.png
刷新模型路径,选择匹配的GPT和SoVITS模型。
image.png
需要上传说话者一段3-10秒内的声音片段。这个声音片段会影响生成结果的语速和情绪(这个声音片段对结果影响很大)。
image.png
上传的音频文本和语言类型。

需要生成的语音文本

标点符号会影响生成结果的停顿。把文本粘贴进去,选择语言和文本切割方式,参数默认,点击合成语音等待生成结果。即使训练的数据没有英文和日文,也可以生成英文和日文音频。
image.png

文本切割工具

和上面的文本切割功能一样。将大段文字切割。
image.png

注意

模型训练过程中GPU会发热,请在有人监控的情况下进行,温度过高及时停止(在控制台输入CTRL+C)以防发生意外。

http://www.lryc.cn/news/338977.html

相关文章:

  • 小蚕爬树问题
  • 科研学习|科研软件——如何使用SmartPLS软件进行结构方程建模
  • 实用工具系列-ADB使用方式
  • 计算机网络书籍--《网络是怎样连接的》阅读笔记
  • antd+vue——datepicker日期控件——禁用日期功能
  • 技术分享 | Appium 用例录制
  • [蓝桥杯 2018 省 A] 付账问题
  • 设计模式|装饰器模式(Decorator Pattern)
  • 发作性睡病有性别差异吗?
  • ppt从零基础到高手【办公】
  • 文件上传下载
  • C++11 新特性:新增算法
  • c/c++普通for循环学习
  • 操作系统组成部分
  • 深入理解DES算法:原理、实现与应用
  • # 达梦sql查询 Sql 优化
  • Linux下SPI驱动:SPI设备驱动简介
  • 【简明图文教程】Node.js的下载、安装、环境配置及测试
  • 共模电感饱和与哪些参数有关?这些参数是如何影响共模电感的?
  • 儿童护眼台灯怎么选?五款必选的高口碑护眼台灯推荐
  • 前端小技巧之轮播图
  • 手动实现简易版RPC(上)
  • 大语言模型总结整理(不定期更新)
  • 关于npm和yarn的使用(自己的问题记录)
  • Web端Excel的导入导出Demo
  • Java日期正则表达式(附Demo)
  • 基于LabVIEW的CAN通信系统开发案例
  • SAP SD学习笔记07 - 紧急发注(急单),现金贩卖,贩卖传票Type/ 明细Category 及其Customize
  • (六)C++自制植物大战僵尸游戏关卡数据讲解
  • Java基于微信小程序的校园外卖平台设计与实现,附源码