当前位置: 首页 > news >正文

《昇思25天学习打卡营第9天|onereal》

继续学习昨天的  基于MindNLP+MusicGen生成自己的个性化音乐

生成音乐

MusicGen支持两种生成模式:贪心(greedy)和采样(sampling)。在实际执行过程中,采样模式得到的结果要显著优于贪心模式。因此我们默认启用采样模式,并且可以在调用MusicgenForConditionalGeneration.generate时设置do_sample=True来显式指定使用采样模式。

无提示生成¶

我们可以通过方法 MusicgenForConditionalGeneration.get_unconditional_inputs 获得网络的随机输入,然后使用 .generate 方法进行自回归生成,指定 do_sample=True 来启用采样模式:

音频输出是格式是: a Torch tensor of shape (batch_size, num_channels, sequence_length)

使用第三方库scipy将输出的音频保存为musicgen_out.wav 文件。

文本提示生成

首先基于文本提示,通过AutoProcessor对输入进行预处理。然后将预处理后的输入传递给 .generate 方法以生成文本条件音频样本。同样,我们通过设置“do_sample=True”来启用采样模式。

其中,guidance_scale 用于无分类器指导(CFG),设置条件对数之间的权重(从文本提示中预测)和无条件对数(从无条件或空文本中预测)。guidance_scale越高表示生成的模型与输入的文本更加紧密。通过设置guidance_scale > 1来启用 CFG。为获得最佳效果,使用guidance_scale=3(默认值)生成文本提示音频。

  可能是算力不够,一直在运行,没有出结果。

不过经过等待终于出了点声音。

声音很短:只是5秒。但是的确是生成的。其他的代码运行还未结束。

http://www.lryc.cn/news/389503.html

相关文章:

  • Wireshark - tshark支持iptables提供数据包
  • 快团团团长如何批量退款可自定义退款金额(批量退差价)?
  • MySQL——事务ACID原则、脏读、不可重复读、幻读
  • 洗衣机水龙头要买有止逆阀的,多花几十元能省掉几万,值了
  • Android 蓝牙开发全面指南
  • Hadoop3:Yarn框架的三种调度算法
  • JDBC链接kerberos认证的impala数据库报错问题解决
  • firewalld(2)安装、配置文件、规则查询
  • 施耐德全新EtherCAT运动控制器M310介绍
  • Springboot Mybatis 多数据源配置以及使用
  • Android启动时间分析
  • 智能洗车管理系统设计
  • vue3弹窗usehook
  • 上帝之眼(BEVSee):多相机间无需标定,将各自目标统一到同一坐标系下(代码开源,提供数据集)
  • imagesc函数 纵坐标翻转 colormap “set” “jet“
  • Postman接口测试工具的原理及应用详解(二)
  • IPython脚本加载秘籍:探索脚本魔法的艺术
  • 使用shell脚本进行clang-tidy静态代码分析
  • PHP和phpSpider:如何应对网站变动导致的数据爬取失败?
  • 聊聊etsy平台,一个年入百万的项目
  • SyntaxError: Unexpected token ‘??=‘
  • python如何输出list
  • 【面试系列】SQL 高频面试题
  • 【代码随想录训练营】【Day 66】【图论-3】| 卡码 101-104
  • 【面试系列】C#高频面试题
  • AI助力校园安全:EasyCVR视频智能技术在校园欺凌中的应用
  • Yolov8可视化界面使用说明,含代码
  • 怎么使用MarkDown画矩阵
  • Kafka入门-基础概念及参数
  • Clickhouse 常见操作