当前位置: 首页 > news >正文

语音识别数据增强

目录

Whisper-Finetune的数据增强

其他数据增强:


Whisper-Finetune的数据增强

https://github.com/yeyupiaoling/Whisper-Finetune

https://github.com/yeyupiaoling/Whisper-Finetune/blob/master/configs/augmentation.json

[{"type": "resample","params": {"new_sample_rates": [8000, 32000, 44100]},"prob": 0.0},{"type": "noise","params": {"min_snr_dB": 10,"max_snr_dB": 50,"noise_dir": "dataset/noise"},"prob": 0.2},{"type": "speed","params": {"min_speed_rate": 0.9,"max_speed_rate": 1.1,"num_rates": 3},"prob": 0.5},{"type": "shift","params": {"min_shift_ms": -5,"max_shift_ms": 5},"prob": 0.0},{"type": "volume","params": {"min_gain_dBFS": -15,"max_gain_dBFS": 15},"prob": 0.5}
]

其他数据增强:

1.语音合成数据增强:

2.一段语音,一段文字,随意拆分的话,语音要拆分,文字也要对应拆分。

http://www.lryc.cn/news/603114.html

相关文章:

  • Redis实战(3)-- 高级数据结构zset
  • C++现代Redis客户端库redis-plus-plus详解
  • 第四章:分析 Redis 性能高原因和核心字符串类型命令
  • 散点图(散点矩阵)相关介绍
  • 3. Socket 编程 TCP
  • 群晖Synology Drive:打造高效安全的私有云协作平台
  • TDengine 中 TDgpt 用于异常检测
  • 【51单片机2位数码管跑马灯】2022-9-25
  • 04动手学深度学习(下)
  • C++ 哈希算法、贪心算法
  • 【硬件】LVGL
  • 六轴机械臂cad【11张】三维图+设计说明书
  • 用latex+vscode+ctex写毕业论文
  • node后端-JWT认证
  • 使用Ettus USRP X440对雷达和EW系统进行原型验证
  • 自定义spring-boot-starter
  • Python defaultdict 的强大之处:告别繁琐的字典键检查: Effective Python 第17条
  • days34:零基础学嵌入式之数据存储——数据库
  • Sentinel 不同层面的流控保护
  • Java中实现定时任务执行的方式总结
  • 反欺诈系统:Oracle 到 ES 迁移实战
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博文章数据可视化分析-点赞区间实现
  • Java类加载机制详解
  • AI coding汇总持续更新
  • STM32启动流程
  • 【学习路线】Android开发2025:从入门到高级架构师
  • Unity_UI_NGUI_锚点组件
  • 【java面试day7】redis分布式锁
  • SpringBoot 发送邮件
  • 五自由度磁悬浮轴承转子不平衡质量的高性能控制策略全解析