当前位置: 首页 > news >正文

【fish-speech】新模型openaudio-s1-mini尝鲜

一、配置

显卡:v100(测试简短语句,显存实际占用不足6G)

二、安装测试

1. 安装

1.1 下载源码

git clone https://github.com/fishaudio/fish-speech.git

1.2 安装系统组件

apt install portaudio19-dev libsox-dev ffmpeg

1.3 conda创建虚拟环境

conda create -n fish-speech python=3.12
conda activate fish-speechpip install -e .

2. 下载模型

cd /data/models
mkdir openaudio-s1-mini
modelscope download --model fishaudio/openaudio-s1-mini --local_dir ./openaudio-s1-mini

3. webui测试

3.1 启动命令

export GRADIO_SERVER_NAME=192.168.114.114
python -m tools.run_webui \--llama-checkpoint-path "/data/models/openaudio-s1-mini" \--decoder-checkpoint-path "/data/models/openaudio-s1-mini/codec.pth" \--decoder-config-name modded_dac_vq

3.2 访问

页面:http://192.168.114.114:7860/

  • 随机音色

在Input Text中键入要生成的文字,点击Generate。

在这里插入图片描述

  • 固定音色

需要在Reference Audio上传音频和Reference Text键入音频对应的文字,之后就可以在Input Text中键入要生成的文字,点击Generate即可。

在这里插入图片描述

4. api测试

4.1 启动服务端

python -m tools.api_server \--llama-checkpoint-path "/data/models/openaudio-s1-mini" \--decoder-checkpoint-path "/data/models/openaudio-s1-mini/codec.pth" \--decoder-config-name modded_dac_vq

4.2 客户端调用

默认保存到generated_audio.wav,也可以通过指定--output参数重命名。

  • 随机音色
python tools/api_client.py \-t '在《长安的荔枝》开播并收获一众好评后,又一有着大爆剧潜质的《以法之名》也紧接着播出了。' \--no-play
  • 固定音色

–reference_audio指定要参考的音频,–reference_text指定参考音频的文字,-t指定要生成的音频文字,–no-play禁止生成后播放。

python tools/api_client.py \-t '在《长安的荔枝》开播并收获一众好评后,又一有着大爆剧潜质的《以法之名》也紧接着播出了。' \--no-play \--reference_audio 'fake.wav' \--reference_text '您想要转换的文本'

5. 总结

fish-speech和各类工具,功能越来越强大的同时,v100这些旧显卡,也渐渐要退出历史舞台了,官方文档说您可能希望使用 --compile 来融合 CUDA 内核以实现更快的推理(~15 token/秒 -> ~150 token/秒,在RTX 4090 GPU上,但是v100不支持了。

http://www.lryc.cn/news/575431.html

相关文章:

  • 【windows处理技巧】如何缩小PDF
  • R语言机器学习算法实战系列(二十六)基于tidymodels的XGBoost二分类器全流程实战
  • 【力扣 困难 C】32. 最长有效括号
  • 数据结构进阶 - 第三章 栈与队列
  • ubuntu 下cursor的安装
  • 深入了解 AWS EventBridge
  • 多相机人脸扫描设备如何助力高效打造数字教育孪生体?
  • Java设计模式->责任链模式的介绍
  • 书籍在行列都排好序的矩阵中找数(8)0626
  • 【音视频】Ubuntu下配置ffmpeg库
  • Maven Javadoc 插件使用详解
  • 【WebSocket】学习总结
  • Python 数据分析与可视化 Day 8 - Pandas 高级操作技巧
  • MFC制作动态波形图( ChartCtrl)
  • Python(一)实现一个爬取微信小程序数据的爬虫+工程化初步实践
  • 【FR801xH】Ubuntu24.04搭建富芮坤FR801xH系列开发环境教程
  • 美团京东Clean Architecture实战
  • 【算法深练】栈特性的解题密码:LIFO规则在题型中的灵活运用
  • 生僻字处理工具类
  • 价格敏感带争夺战!澳洲电商双雄增长密码,3大本土护城河尚存
  • C# 项目使用obfuscar混淆
  • 华曦达港股IPO递表,AI Home生态构建智能生活新蓝图
  • 2025 Java开发生态全景图:云原生、AI与性能优化的技术融合
  • 广州华锐互动:技术与创意双驱动的 VR 先锋​
  • 基于组件的软件开发(CBSD)与面向服务的架构(SOA)的对比分析
  • Android-Layout Inspector使用手册
  • VSCode插件开发
  • Vue3 中 toRef 与 toRefs 的深度解析与实战应用
  • Sentinel 授权规则详解与自定义异常处理
  • 【机器学习第一期(Python)】梯度提升决策树 GBDT