当前位置: 首页 > news >正文

AudioSep:从音频中分离出特定声音(人声、笑声、噪音、乐器等)本地一键整合包下载

AudioSep是一种 AI 模型,可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发,使用户能够通过简单的语言描述来分离各种声音源。

比如在嘈杂的人流车流中说话的录音中,可以分别提取干净的人声说话声音和嘈杂的人流车流噪声。可以根据需求分离,保留人声或者噪声。甚至可以单独提取声音中的笑声。除此之外,还能提取伴奏声音里指定的乐器声音,比如一段钢琴和吉他合奏曲目,需要单独分离钢琴曲,就可以用这个项目来实现。
但缺点是目前不支持歌曲的人声和伴奏分离,如果有类似需求,可以尝试用 UVR5 来分离,这个工具恰好弥补了UVR5的不足,两者相辅相成,AI语音项目里的两个神器。
做AI语音训练的人都知道,一段干净的纯人声是多么的重要,一个声音模型的好坏,就取决于人声素材的纯净与否,这个工具的出现,大大解决了分离声音素材噪声的问题,相信在这个工具的加持下,训练的声音模型会有本质的提升。


除了使用现有模型分离,还支持自己训练指定的音频数据集模型来实现特殊的音频分离场景。

项目地址: https://github.com/Audio-AGI/AudioSep

本地一键整合包:AudioSep:从音频中分离出特定声音(人声、笑声、噪音、乐器等)本地一键整合包下载

使用说明:

双击启动一键整合包,点击一键启动,等待自动跳转到WebUI界面

点击上传需要分离的音频素材,如下图

输入要保留的音频元素,比如从噪声中分离说话的声音,就输入 speech,英文不好的可以借助翻译工具


最后点提取,等待完成即可。

成功后,输出区域会显示提取后的音频,可以点击试听,并根据需要下载到本地。如下图


http://www.lryc.cn/news/379456.html

相关文章:

  • Prompt 提示词工程:翻译提示
  • 【MySQL 的三大日志的作用】
  • 数据库中数据的id生成和算法
  • SystemVerilog Assertion精华知识
  • pdf怎么压缩到2m以内或5m以内的方法
  • Butter Knife 8
  • AMSR/ADEOS-II L1A Raw Observation Counts V003地球表面和大气微波辐射的详细观测数据
  • MySQL之复制(十一)
  • 深入源码设计!Vue3.js核心API——Computed实现原理
  • 驾考小技巧:老北京布鞋!距离高考出分还剩3天,我却看到有些孩子已经拿了“满分”——早读(逆天打工人爬取热门微信文章解读)
  • java-正则表达式 2
  • hadoop常见简单基础面试题
  • 泄漏检测(LDAR)在建档和检测过程中造假套路和不规范行为
  • Android CTS环境搭建
  • 比较Zig、Rust和C++
  • 路由的params参数,命名路由,路由的params参数,命名路由
  • java:CompletableFuture的简单例子
  • element的table获取当前表格行
  • html做一个分组散点图图的软件
  • 【SQL】UNION 与 UNION ALL 的区别
  • 分类判决界面---W-H、H-K算法
  • Python基础教程(三十):math模块
  • 你只是重新发现了一些东西
  • 【英伟达GPU的挑战者】Groq—AI大模型推理的革命者
  • Python学习路线
  • C++ std::forward()
  • 常见的8种排序(含代码):插入排序、冒泡排序、希尔排序、快速排序、简单选择排序、归并排序、堆排序、基数排序
  • go语言day2
  • vue echarts画多柱状图+多折线图
  • cesium for unity 打包webgl失败,提示不支持