当前位置: 首页 > news >正文

音频提取特征

目录

音频提取特征

音频切割


依赖项:

pip install librosa

pip install transformers

音频提取特征

import librosa
import numpy as np
import torch
from transformers import Wav2Vec2Processorprocessor = Wav2Vec2Processor.from_pretrained("facebook/wav2vec2-base-960h")wav_path = r'E:\迅雷下载\data\finedance\music_wav\001.wav'
speech_array, sampling_rate = librosa.load(wav_path, sr=16000)
input_values = np.squeeze(processor(speech_array, sampling_rate=16000).input_values)print(input_values.shape)

音频切割

import librosa as lr
import numpy as np
import soundfile as sf
from tqdm import tqdmdef slice_audio(audio_file, stride, length, out_dir):# stride, length in secondsaudio, sr = lr.load(audio_file, sr=None)file_name = os.path.splitext(os.path.basename(audio_file))[0]start_idx = 0idx = 0window = int(length * sr)stride_step = int(stride * sr)while start_idx <= len(audio) - window:audio_slice = audio[start_idx : start_idx + window]sf.write(f"{out_dir}/{file_name}_slice{idx}.wav", audio_slice, sr)start_idx += stride_stepidx += 1return idxdef slice_audio_folder(wav_dir, stride=0.5, length=5):wavs = sorted(glob.glob(f"{wav_dir}/*.wav"))wav_out = wav_dir + "_sliced"os.makedirs(wav_out, exist_ok=True)for wav in tqdm(wavs):audio_slices = slice_audio(wav, stride, length, wav_out)if __name__ == '__main__':slice_audio_folder(r"E:\Projects\FineDance-main\data\code")

http://www.lryc.cn/news/347613.html

相关文章:

  • AJAX前端与后端交互技术知识点以及案例
  • [AutoSar]BSW_Diagnostic_003 ReadDataByIdentifier(0x22)介绍
  • 买卖股票的最佳时机 II(LeetCode 122)
  • Spring Boot:让微服务开发像搭积木一样简单!
  • WordPress 、Typecho 站点的 MySQL/MariaDB 数据库优化
  • ==与===的区别
  • 什么是ACID及基本实现的示例
  • 【启明智显技术分享】SSD202核心板Rootfs下如何烧录mac地址
  • springboot3 集成spring-authorization-server (一 基础篇)
  • AVL树!
  • 知识付费系统怎么安装教程,教师课堂教学该掌握哪些表达技巧?
  • 基于MetaGPT的LLM Agent学习实战(一)
  • 【IMX6ULL项目】IMX6ULL上Linux系统实现产测工具框架
  • 【Linux基础】Vim保姆级一键配置教程(手把手教你把Vim打造成高效率C++开发环境)
  • Gartner发布准备应对勒索软件攻击指南:勒索软件攻击的三个阶段及其防御生命周期
  • IB 公式解析
  • 开发辅助工具的缩写
  • linux程序分析命令(一)
  • MYSQL数据库-SQL语句
  • MyBatis认识
  • 【WEEK11】 【DAY6】Employee Management System Part 7【English Version】
  • 【52】Camunda8-Zeebe核心引擎-Clustering与流程生命周期
  • 从零开始的软件测试学习之旅(八)jmeter线程组参数化及函数学习
  • 图文并茂:解析Spring Boot Controller返回图片的三种方式
  • 问题处理记录 | 表输出报错 Packet for query is too large (5,214,153 > 4,194,304).
  • 数据结构_栈和队列(Stack Queue)
  • 基于docker 的elasticsearch冷热分离及生命周期管理
  • pikachu靶场(xss通关教程)
  • 实验0.0 Visual Studio 2022安装指南
  • 数据结构之----线性表