当前位置: 首页 > news >正文

如何在算家云搭建MVSEP-MDX23(音频分离)

一、MVSEP-MDX23简介

模型GitHub网址:MVSEP-MDX23-music-separation-model/README.md 在 main ·ZFTurbo/MVSEP-MDX23-音乐分离模型 ·GitHub 上

在音视频领域,把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有原始工程文件的情况下,将其还原和分离是一件很有难度的事情。MVSEP-MDX23音乐分离模型是基于 Demucs4、MDX 神经网络架构和 Ultimate Vocal Remover 项目中的一些 MDX 权重。该模型在MultiSong 数据集上执行的最佳分离模型进行质量比较,发现该模型在SDR(信噪比)中比Demucs HT 4、Demucs 3、MDX B模型效果好。该模型有图形用户界面,web界面,本容器主要运用web界面,如下图所示:

m1.png

将对上传的音频文件进行声音分离及显示频谱信息,分为人声、仪器、器乐、低音、鼓、其他六部分,以及相应的频谱图:

image.png

二、模型搭建流程

1.容器镜像一键使用

在“租用实例”页面进入应用社区,选择MVSEP-MDX23

1727071404530_image.png

image.png

(2)选择3090或其他性能优于3090的显卡,点击“立即创建”

image.png

2.进入创建的实例

在“项目实例”页面点击对应实例的“Web SSH”操作

3060.jpg

image.png

以下命令均在该页面进行:

· 打开项目文件所在位置

cd MVSEP-MDX23-music-separation-model

· 激活ck虚拟环境

conda activate ck

· 更新gradio

pip install --upgrade gradio

· 指定端口即可启动项目,启动命令如下:

export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python web-ui.py

出现以下页面代表运行成功:

image.png

3.开启外部访问获取访问链接

返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。

image.png

有两种访问方式可以选择:本地私密访问和对外开放端口

(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”

image.png

(2)对外开放端口:请按照下图操作

image.png

4.进入 webUI 界面后即可操作

将复制的访问网址粘贴到新网页即可开始 ui 界面的使用。注意:上传音频时长过长,处理过程容易报错,需要修剪到8秒左右。另外需要勾选“使用单个ONNX”才能运行成功

image.png

以上就是在算家云搭建 MVSEP-MDX23 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击容器中心 算家云,选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png

http://www.lryc.cn/news/451064.html

相关文章:

  • 常用的Java安全框架
  • 使用 PHP 的 strip_tags函数保护您的应用安全
  • 您的计算机已被Lockbit3.0勒索病毒感染?恢复您的数据的方法在这里!
  • 经典sql题(十二)UDTF之Explode炸裂函数
  • 【AIGC】ChatGPT提示词解析:如何打造个人IP、CSDN爆款技术文案与高效教案设计
  • 【Ubuntu】Ubuntu常用命令
  • 架构设计笔记-5-软件工程基础知识-2
  • [网络]抓包工具介绍 tcpdump
  • 基于STM32和FPGA的射频数据采集系统设计流程
  • 自动变速箱系统(A/T)详细解析
  • 【Kubernetes】常见面试题汇总(四十三)
  • OpenCL 学习(1)---- OpenCL 基本概念
  • 自定义注解加 AOP 实现服务接口鉴权以及内部认证
  • 《软件工程概论》作业一:新冠疫情下软件产品设计(小区电梯实体按钮的软件替代方案)
  • 基于Ernie-Bot打造语音对话功能
  • 动手学深度学习(李沐)PyTorch 第 3 章 线性神经网络
  • ROS理论与实践学习笔记——2 ROS通信机制之服务通信
  • 技术成神之路:设计模式(十八)适配器模式
  • 图神经网络:处理复杂关系结构与图分类任务的强大工具
  • LeetCode: 1971. 寻找图中是否存在路径
  • mysql 查询表所有数据,分页的语句
  • TI DSP TMS320F280025 Note13:CPUtimer定时器原理分析与使用
  • Australis 相機率定軟體說明
  • C++入门(有C语言基础)
  • 第四届高性能计算与通信工程国际学术会议(HPCCE 2024)
  • 负载均衡架构解说
  • 【异常数据检测】孤立森林算法异常数据检测算法(数据可视化 Matlab语言)
  • MKV转MP4丨FFmpeg的简单命令使用——视频格式转换
  • git使用“保姆级”教程4——版本回退及分支讲解
  • spring cache,Spring data redis