当前位置: 首页 > news >正文

如何在算家云搭建GPT-SOVITS(语音转换)

一、模型介绍

GPT-SOVITS是一款强大的小样本语音转换和文本转语音 WebUI工具。它集成了声音伴奏分离、自动训练集分割、中文ASR和文本标注等辅助工具。

具有以下特征:

  • 零样本 TTS: 输入 5 秒的声音样本并体验即时文本到语音的转换。
  • 少量样本 TTS: 仅使用 1 分钟的训练数据对模型进行微调,以提高语音相似度和真实感。
  • 跨语言支持:使用不同于训练数据集的语言进行推理,目前支持英语、日语、韩语、粤语和中文。
  • WebUI 工具: 集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注,帮助初学者创建训练数据集和 GPT/SoVITS 模型。

二、模型搭建流程

环境测试

模型已在 RTX 3090,CUDA12.2 上测试完成

1. 创建容器实例

  • 进入算家云的“应用社区”,点击搜索找到"GPT-SOVITS",点击“创建应用”,即可进入容器平台

image.png

image.png

  • 点击进入之后会自动匹配模型,选择显卡,点击“立即创建”即可创建实例

image.png

  • 也可以点击”专业创建“,自主选择 GPU 型号、计费方式等配置

image.png

2. 进入创建的实例

  • 实例创建成功之后,点击“项目实例”再点击“WebShell”开启终端(小黑屏)

image.png

3. 终端操作

  • 进入命令操作页后,输入或者复制粘贴一下命令
cd /GPT-SoVITS/
conda activate GPTSoVits
python webui.py

[注]本模型需用隧道工具开多端口,如下图:

image.png

image.png

此时的访问地址(http://127.0.0.1:端口号)为

http://127.0.0.1:8080

http://127.0.0.1:9873

4. Web页面演示

image.png

以上就是在算家云搭建 GPT-SOVITS 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击算家云-应用社区,选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png

http://www.lryc.cn/news/470086.html

相关文章:

  • ThinkPad T480拆机屏幕改装:便携式显示器DIY指南
  • C++ (8) C++11及更新特性:探索魔法新领域
  • 【vue】Mammoth.js的使用:将.docx和doc 文件转换成HTML
  • HarmonyOS介绍 第一课习题答案
  • c/c++ stdcall cdel fastcall等函数调用约定说明
  • 【ROS概述】概念及环境搭建
  • MongoDB Shell 基本命令(三)生成学生脚本信息和简单查询
  • java核心技术点都有哪些
  • 4404 - 提高:二分与三分:曲线(三分)
  • 软件工程--需求分析与用例模型
  • 预测房价学习
  • 电脑无法上网,但是微信、QQ可以正常使用
  • C++11新特性(列表初始化与右值引用折叠与完美转发)
  • 基于SSH的物流运输货运车辆管理系统源码
  • 基于RabbitMQ,Redis,Redisson,RocketMQ四种技术实现订单延时关闭功能及其相关优缺点介绍(以12306为主题)
  • HarmonyOS ArkTS与C++数据类型转换
  • 腾讯云或阿里云centos7安装Redis,并解决端口无法访问的问题
  • 【小问题】距离估计和频率估计的方差下界推导出距离估计的方差下界
  • Selenium爬虫技术:如何模拟鼠标悬停抓取动态内容
  • Z-BlogPHP显示错误Undefined array key 0 (set_error_handler)的解决办法
  • java-实例化一个List,然后添加数据的方法详解
  • 【Linux系统】Ubuntu的简单操作
  • 标准日志插件项目【C/C++】
  • SpingBoot原理
  • Cout输出应用举例
  • java的无锁编程和锁机制
  • vue实现富文本编辑器上传(粘贴)图片 + 文字
  • 子集和全排列(深度优先遍历)问题
  • 判断检测框是否在感兴趣区域(ROI)内
  • 正点原子阿尔法ARM开发板-IMX6ULL(九)——关于SecureCRT连接板子上的ubuntu