当前位置: 首页 > news >正文

c++通过自然语言处理技术分析语音信号音高

        对于语音信号的音高分析,可以使用基频提取技术。基频是指一个声音周期的重复率,也就是一个声音波形中最长的周期。

通常情况下,人的声音基频范围是85Hz到255Hz。根据语音信号的基频可以推断出其音高。

        C++中可以使用数字信号处理库或语音处理库,比如MATLAB、Praat、YIN算法等等来进行音高分析。以下是使用YIN算法进行音高分析的示例代码:

#include <cmath>
#include <algorithm>#define SAMPLE_RATE 44100
#define BUFFER_SIZE 2048
#define MIN_FREQ 80
#define MAX_FREQ 1000double YinPitch(float* buffer, int bufferSize)
{double pitch = -1;double yin[BUFFER_SIZE/2];for (int tau = 0; tau < bufferSize/2; tau++){yin[tau] = 0;for (int j = 0; j < bufferSize/2; j++){double diff = buffer[j] - buffer[j+tau];yin[tau] += diff * diff;}yin[tau] /= bufferSize/2;}for (int tau = 1; tau < bufferSize/2; tau++){if (yin[tau] < 0.0001){continue;}int period = tau;while ((period < bufferSize/2) && (yin[period] < yin[period-1])){period++;}if (period >= bufferSize/2){break;}double freq = SAMPLE_RATE / period;if ((freq >= MIN_FREQ) && (freq <= MAX_FREQ)){if (pitch < 0){pitch = freq;}else{pitch = 0.5 * pitch + 0.5 * freq;}}}return pitch;
}

        这段代码使用了YIN算法来计算语音信号的基频,得出的结果即为音高。

        其中,缓冲区大小为2048,最小基频为80Hz,最大基频为1000Hz。通常情况下,音高在85Hz到255Hz之间,因此可以根据实际情况修改最小和最大基频值。

http://www.lryc.cn/news/104524.html

相关文章:

  • [pymc3][python]pymc3安装后测试代码2
  • Go语言time库,时间和日期相关的操作方法
  • JVM总结笔记
  • C++ 缓存再排序,解决多线程处理后的乱序问题,不知道思路对不对[挠下巴]
  • 华为数通HCIA-地址分类及子网划分
  • Linux第七章之gdb与makefile使用
  • Mycat-Balance使用指南
  • 玩转顺序表——【数据结构】
  • SSE(Server-Sent Events,服务器推送事件)和sockets(套接字)通信区别
  • 【设计模式——学习笔记】23种设计模式——代理模式Proxy(原理讲解+应用场景介绍+案例介绍+Java代码实现)
  • 大学英语四新视野 课后习题+答案翻译 Unit1~Unit8
  • Java入门指南:Java语言优势及其特点
  • Jenkins 节点该如何管理?
  • hugging face下载数据集
  • 解决Django报错 : No module named ‘MySQLdb‘
  • 【Docker】Docker的优势、与虚拟机技术的区别、三个重要概念和架构及工作原理详细讲解
  • 【论文笔记】RCM-Fusion: Radar-Camera Multi-Level Fusion for 3D Object Detection
  • STM32-风速传感器(ADC)
  • 【conda】配置国内镜像源
  • python森林生物量(蓄积量)数据处理到随机森林估算全流程
  • 使用Freemarker模版导出xls文件使用excel打开提示文件损坏
  • 初识Linux
  • python——案例六:清空列表用clear()方法实现
  • 测试|Selenium之WebDriver常见API使用
  • 手把手教你uniapp和小程序分包
  • Java中的代理模式
  • LeetCode每日一题——1331.数组序号转换
  • 2、Tomcat介绍(下)
  • JAVA 正则表达式(heima)
  • 布瑞特单圈绝对值旋转编码器串口数据读取