当前位置: 首页 > news >正文

声音训练数据集哪里找?中文、英文

一般找数据集的都是需要训练底膜的,大家git上找的开源项目大多是预训练模型。预训练就是别人已经训练好的底膜,你在他的基础上进行调整。而我们训练如果他这个模型不理想是需要训练底膜的。


找的方式是从git开源上找

中文

推荐MockingBird,知更鸟里面有很多对外的中文数据集,或者去阿里的modelscope里面有数据集。

https://github.com/babysor/MockingBird/blob/main/README-CN.md

英文的,我找了几个比较好的

GitHub - robmsmt/ASR-Audio-Data-Links: A list of publically available audio data that anyone can download for ASR or other speech activities

点击可以直接进入,下载,有火狐还有一些非盈利公司等提供的音频

关于其他语言

就要自己在git上看了,总之git上都有,开源大家庭就是好啊,造福全人类呀

http://www.lryc.cn/news/223005.html

相关文章:

  • springboot中如何同时操作同一功能
  • YOLOWeeds: 用于棉花生产系统中多类杂草检测的 YOLO 目标检测器的新基准
  • Vue3:自定义图标选择器(包含 SVG 图标封装)
  • NIO讲解
  • react中jest配置,解决node_modules报错esm无法解析的问题
  • Qt6,使用 UI 界面完成命令执行自动化的设计
  • Apache Maven;会话技术
  • Azure - 机器学习:使用自动化机器学习训练计算机视觉模型的数据架构
  • 【C++】stack | queue | priority_queue | deque
  • 华为gre带验证key案例
  • Java算法(三): 判断两个数组是否为相等 → (要求:长度、顺序、元素)相等
  • 基于STM32的设计智慧超市管理系统(带收银系统+物联网环境监测)
  • 深入浅出理解ResNet网络模型+PyTorch实现
  • 【C++】万字一文全解【继承】及其特性__[剖析底层化繁为简](20)
  • 微信小程序之自定义组件开发
  • MCU系统的调试技巧
  • 【机器学习基础】机器学习概述
  • Python Selenium 执行 JavaScript
  • HTML的表单标签和无语义标签的讲解
  • 8.spark自适应查询-AQE之自适应调整Shuffle分区数量
  • 【Java 进阶篇】Java Filter 快速入门
  • Pytorch R-CNN目标检测-汽车car
  • 【PG】PostgreSQL13主从流复制部署(详细可用)
  • 学习pytorch15 优化器
  • [算法日志]图论刷题 沉岛思想的运用
  • Web服务器的搭建
  • 如何使用 GTX750 或 1050 显卡安装 CUDA11+
  • 跟着森老师学React Hooks(1)——使用Vite构建React项目
  • 强力解决使用node版本管理工具 NVM 出现的问题(找不到 node,或者找不到 npm)
  • Docker指定容器使用内存