当前位置: 首页 > news >正文

个性化音频生成GPT-SoVits部署使用和API调用

一、训练自己的音色模型步骤

1、准备好要训练的数据,放在Data文件夹中,按照文件模板中的结构进行存放数据

在这里插入图片描述
在这里插入图片描述

2、双击打开go-webui.bat文件,等待页面跳转

在这里插入图片描述

3、页面打开后,开始训练自己的模型

(1)、人声伴奏分离。

点击打开人声伴奏分离批量处理界面(如果没有伴奏背景可以省略这一步)
在这里插入图片描述
在这里插入图片描述

(2)、音频切割。

在这里插入图片描述

(3)、识别语音中的文本。

在这里插入图片描述

(4)、文本语音校对。

在这里插入图片描述
在这里插入图片描述

(5)、提取训练前所需信息

在这里插入图片描述

(6)、开始训练模型

在这里插入图片描述

(7)、测试自己的模型

在这里插入图片描述
在这里插入图片描述

二、API调用

1、创建一个conda虚拟环境,安装requirements.txt所需要的库

如果需要使用gpu,安装的cuda和torch版本推荐:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

2、安装好后,运行api.py文件,根据格式进行API调用

在这里插入图片描述

http://www.lryc.cn/news/407165.html

相关文章:

  • MFC列表框示例
  • Android TabLayout的简单用法
  • 基于vite + pnpm monorepo 实现一个UI组件库
  • FDM3D打印系列——Luck13关节可动模型打印和各种材料的尝试
  • windows10 获取磁盘类型
  • 数据库之运算符
  • 【自动化机器学习AutoML】AutoML工具和平台的使用
  • 【每日一练】python求最后一个单词的长度
  • [红明谷CTF 2021]write_shell 1
  • 【Go - sync.once】
  • Spark RPC框架详解
  • win10安装ElasticSearch7.x和分词插件
  • Linux中,MySQL的用户管理
  • 个人电脑网络安全 之 防浏览器和端口溢出攻击 和 权限对系统的重要性
  • 美食聚焦 -- 仿大众点评项目技术难点总结
  • 拓扑图:揭示复杂系统背后的结构与逻辑
  • Java面试八股之什么是spring boot starter
  • 探究项目未能获得ASPICE 1、2级能力的原因及改进策略
  • WHAT - 不同 HTTP Methods 使用场景、使用方法和可能遇到的问题
  • Pytorch使用教学4-张量的索引
  • 【Git多人协作开发】同一分支下的多人协作开发模式
  • Vue使用FullCalendar实现日历/周历/月历
  • 社交圈子聊天交友系统搭建社交app开发:陌生交友发布动态圈子单聊打招呼群聊app介绍
  • 【微信小程序实战教程】之微信小程序原生开发详解
  • PHP身份证实名认证接口集成守护电商购物
  • 为什么有了MAC还需要IP?
  • SpringBoot中如何使用RabbitMq
  • LangChain自定义Embedding封装 之 ERNIE Bot
  • Git 安装教程
  • Lua 类管理器