当前位置: 首页 > news >正文

音频分割:长语音音频 分割为 短语音音频 - python 实现

        在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。

        该示例将声音的音量和静默时间结合作为语音的分割条件。

        使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断音频。

按照 python 库:

pip install pydub

具体实现代码如下:

#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''根据 音量 和 静默 时间长度 条件进行音频分割示例:音量阈值 -25 dB , 静默阈值:300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):new = chunks[i]save_name = "{}{}.{}".format(chunks_path,i,audiotype)new.export(save_name, format=audiotype)

​​

助力快速掌握数据集的信息和使用方式。

数据可以如此美好

http://www.lryc.cn/news/462916.html

相关文章:

  • 【Echarts动态排序图,series使用背景色更新动画,背景底色不同步跟随柱子动画】大家有没有解决方案
  • FLINK SQL 元数据持久化扩展
  • MySQL【知识改变命运】04
  • AD9680(adc直采芯片)使用说明
  • 无人机之位置信息计算篇
  • 安卓cpu知识
  • 图书管理新纪元:Spring Boot进销存系统
  • Application protocol
  • 金融信用评分卡建模项目:AI辅助
  • java对接GPT 快速入门
  • 微信小程序引入组件教程
  • STM32—SPI通信外设
  • Ubuntu:用户不在sudoers文件中
  • 五、Spring Boot集成Spring Security之认证流程2
  • 接口测试(全)
  • 【学习】word保存图片
  • 【实战篇】用SkyWalking排查线上[xxl-job xxl-rpc remoting error]问题
  • 三勾软件/ java+springboot+vue3玖玖云电商ERP多平台源码
  • 020 elasticsearch7.10.2 elasticsearch-head kibana安装
  • 基于SpringBoot+Vue的蜗牛兼职网的设计与实现(带文档)
  • Linux 命令 chown 和 chmod 的区别
  • 盘点慢查询原因及优化方法
  • 【热门】智慧果园管理系统解决方案
  • torch.nn.Sequential介绍
  • 使用verilog设计实现的数字滤波器(低通、高通、带通)及其仿真
  • KPaaS集成平台中怎么创建数据可视化大屏
  • 深度学习:网络压缩(Network Compression)详解
  • Go pprof性能分析
  • 扬帆出海!九章云极DataCanvas公司惊艳亮相迪拜GITEX Global 2024
  • Qt | 元对象+元枚举+Qt自带图标案例