当前位置: 首页 > news >正文

昇思25天学习打卡营第13天|基于MindNLP+MusicGen生成自己的个性化音乐

关于MindNLP

MindNLP是一个依赖昇思MindSpore向上生长的NLP(自然语言处理)框架,旨在利用MindSpore的优势特性,如函数式融合编程、动态图功能、数据处理引擎等,致力于提供高效、易用的NLP解决方案。通过全面拥抱Hugging Face等开源社区,实现模型的快速迁移和适配,同时保持对MindSpore特性的深度利用。
应用场景:MindNLP适用于各种NLP任务,包括但不限于文本分类、情感分析、信息抽取、问答系统等。

GitHub仓库:MindNLP的代码仓库位于GitHub上(MindNLP GitHub仓库),用户可以在此获取MindNLP的源代码、文档和示例代码。

安装mindnlp库以及相关依赖库:pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindnlp jieba soundfile librosa
在这里插入图片描述

MindNLP的核心特性

  1. 动态图与静态图的融合:MindNLP在设计上采用了动态图+反向成图的方案,既保证了用户使用的友好性和调试的方便性,又保持了训练性能的优势。
  2. 全面拥抱Hugging Face:MindNLP与Hugging Face社区进行了深度绑定,支持直接使用Hugging Face的Transformers、Peft、Trl等开发库。
    Huggingface入门手册:主要包括计算机视觉、自然语言处理、语音处理、多模态、表格处理、强化学习。

Computer Vision(计算机视觉任务):包括lmage Classification(图像分类),lmage Segmentation(图像分割)、zero-Shot lmage Classification(零样本图像分类)、lmage-to-Image(图像到图像的任务)、Unconditional lmage Generation(无条件图像生成)、Object Detection(目标检测)、Video Classification(视频分类)、Depth Estimation(深度估计,估计拍摄者距离图像各处的距离)

Natural Language Processing(自然语言处理):包括Translation(机器翻译)、Fill-Mask(填充掩码,预测句子中被遮掩的词)、Token Classification(词分类)、Sentence Similarity(句子相似度)、Question Answering(问答系统),Summarization(总结,缩句)、Zero-Shot Classification (零样本分类)、Text Classification(文本分类)、Text2Text(文本到文本的生成)、Text Generation(文本生成)、Conversational(聊天)、Table Question Answer(表问答,1.预测表格中被遮掩单词2.数字推理,判断句子是否被表格数据支持)

Audio(语音):Automatic Speech Recognition(语音识别)、Audio Classification(语音分类)、Text-to-Speech(文本到语音的生成)、Audio-to-Audio(语音到语音的生成)、Voice Activity Detection(声音检测、检测识别出需要的声音部分)

Multimodal(多模态):Feature Extraction(特征提取)、Text-to-Image(文本到图像)、Visual Question Answering(视觉问答)、Image2Text(图像到文本)、Document Question Answering(文档问答)

Tabular(表格):Tabular Classification(表分类)、Tabular Regression(表回归)

Reinforcement Learning(强化学习):Reinforcement Learning(强化学习)、Robotics(机器人)

关于MusicGen

MusicGen支持两种生成模式:贪心(greedy)和采样(sampling)。在实际执行过程中,采样模式得到的结果要显著优于贪心模式。因此我们默认启用采样模式,并且可以在调用MusicgenForConditionalGeneration.generate时设置do_sample=True来显式指定使用采样模式。

基于MindNLP+MusicGen生成自己的个性化音乐

http://www.lryc.cn/news/399054.html

相关文章:

  • nigix的下载使用
  • nginx+lua 实现URL重定向(根据传入的参数条件)
  • 算法学习笔记(8.4)-完全背包问题
  • C++catch (...)陈述
  • Redis实践
  • 【Lora模型推荐】Stable Diffusion创作具有玉石翡翠质感的图标设计
  • vscode 远程开发
  • 前端Vue组件化实践:打造灵活可维护的地址管理组件
  • 虚幻引擎ue5游戏运行界面白茫茫一片,怎么处理
  • 《代理选择与反爬虫策略探究:如何优化网络爬虫效率与稳定性》
  • Kotlin Flow 防抖 节流
  • Android Studio下载与安装
  • 【LC刷题】DAY24:122 55 45 1005
  • 从零开始的python学习生活2
  • 【并发编程】进程 线程 协程
  • Vue的生命周期函数有哪些?详细说明
  • 大语言模型应用--AI工程化落地
  • 我会什么开发技能
  • Run LoongArch64 Alpine VM on x86_64
  • 4层负载均衡和7层负载均衡
  • 前端Vue组件化实践:打造仿京东天猫商品属性选择器组件
  • 智慧城市3d数据可视化系统提升信息汇报的时效和精准度
  • Git 详解(原理、使用)
  • android11为开机动画添加铃声(语音)
  • 使用 Akshare 下载国内的期货(主力连续)、股票和指数的历史行情数据
  • 【React】Google 账号之个性化一键登录按钮功能
  • MySQL已经连接对应数据库,但mapper中表名仍报错
  • CentOS 7:停止更新后如何下载软件?
  • MySQL GROUP_CONCAT 函数详解与实战应用
  • MATLAB Gazebo联合仿真