当前位置: 首页 > news >正文

使用Windows API实现本地音频采集

Windows API提供了Winmm(Windows多媒体)库,其中包括了音频设备相关的函数,可以用来实现音频设备的枚举和测试。

下面是一个简单的示例代码,演示了如何使用Winmm库中的waveInGetNumDevs()函数来枚举计算机上的音频输入设备数量,并使用waveInOpen()函数打开其中一个设备并进行测试录音。

#include <iostream>
#include <Windows.h>
#include <mmsystem.h>#pragma comment(lib, "winmm.lib")void CALLBACK waveInProc(HWAVEIN hwi, UINT uMsg, DWORD_PTR dwInstance, DWORD_PTR dwParam1, DWORD_PTR dwParam2)
{// 实现录音回调函数
}int main() {UINT numDevs = waveInGetNumDevs();std::cout << "Number of audio input devices: " << numDevs << std::endl;WAVEFORMATEX format;format.wFormatTag = WAVE_FORMAT_PCM;format.nChannels = 1;format.nSamplesPerSec = 44100;format.wBitsPerSample = 16;format.nBlockAlign = format.nChannels * format.wBitsPerSample / 8;format.nAvgBytesPerSec = format.nSamplesPerSec * format.nBlockAlign;HWAVEIN hWaveIn;MMRESULT result = waveInOpen(&hWaveIn, WAVE_MAPPER, &format, (DWORD_PTR)waveInProc, NULL, CALLBACK_FUNCTION);if (result == MMSYSERR_NOERROR) {std::cout << "Audio input device opened successfully" << std::endl;// 开始录音result = waveInStart(hWaveIn);if (result == MMSYSERR_NOERROR) {std::cout << "Recording started" << std::endl;}else {std::cerr << "Failed to start recording" << std::endl;waveInClose(hWaveIn);return 1;}// 停止录音system("pause");waveInStop(hWaveIn);waveInReset(hWaveIn);waveInClose(hWaveIn);std::cout << "Recording stopped" << std::endl;}else {std::cerr << "Failed to open audio input device" << std::endl;return 1;}return 0;
}

在这个例子中,waveInGetNumDevs()函数返回了计算机上可用的音频输入设备数量。waveInOpen()函数用于打开音频设备,其中参数WAVE_MAPPER表示使用默认设备,&format指向一个WAVEFORMATEX结构体,描述了所需的音频格式,waveInProc是一个回调函数,用于处理录音数据。然后,waveInStart()函数开始录音,system("pause")函数用于暂停程序,以等待用户手动停止录音。最后,waveInStop()函数停止录音,waveInReset()函数清除录音缓冲区,waveInClose()函数关闭音频设备。

waveInProc是一个回调函数,用于处理录音数据,这个回调函数有五个参数,它们的含义如下:

  • HWAVEIN hwi:表示音频设备的句柄,即与音频设备建立的连接。
  • UINT uMsg:表示回调函数的消息类型,可以是以下值之一:
    • WIM_OPEN:当音频设备已经打开并准备好录音时,发送此消息。
    • WIM_DATA:当音频设备已经采集到音频数据时,发送此消息。
    • WIM_CLOSE:当音频设备已经关闭时,发送此消息。
  • DWORD_PTR dwInstance:一个应用程序定义的32位数值,它在打开音频设备时指定,用于传递应用程序特定的信息。
  • DWORD_PTR dwParam1:当uMsgWIM_OPENWIM_CLOSE时,此参数为0。当uMsgWIM_DATA时,此参数是一个指向WAVEHDR结构体的指针,表示音频数据的头信息。
  • DWORD_PTR dwParam2:当uMsgWIM_OPENWIM_CLOSE时,此参数为0。当uMsgWIM_DATA时,此参数为一个DWORD值,表示已经采集到的音频数据的字节数。

需要注意的是,waveInProc函数是在一个独立的线程中执行的,因此要注意线程安全。

http://www.lryc.cn/news/7093.html

相关文章:

  • 实用的费曼学习法 | 一些思考
  • Linux安装Docker配置docker-compose 编排工具【超详细】
  • iTerm2 + Oh My Zsh 打造舒适终端体验
  • 【scipy.sparse】diags()和dia_matrix()的区别
  • java ssm自行车在线租赁系统idea
  • GAN和CycleGAN
  • 源码项目中常见设计模式及实现
  • KDNM5000-10A-2剩余电流保护器测试仪
  • C++实现线程池
  • 2023最新Java面试手册(性能优化+微服务架构+并发编程+开源框架)
  • 对灵敏度分析技术进行建模(Matlab代码实现)
  • 完整爬虫学习笔记(第一章)
  • 会计师项目管理软件是什么,哪些必不可少的功能
  • 第 8 章 优化
  • 剑指offer -- java题解
  • 若依ruoyi——手把手教你制作自己的管理系统【二、修改样式】
  • 2023.2.14每日一题——455. 分发饼干
  • MySQL入门篇-MySQL常用字符函数小结
  • 解决不同影像裁剪后栅格数据行列不一致问题
  • visual studio2022配置opencv
  • 什么是销售管理?销售管理的五大职能
  • [CVPR‘22] EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks
  • Learning C++ No.9【STL No.1】
  • Apifox推荐-django后台验证token配置
  • SAS应用入门学习笔记6
  • 【3D目标检测】Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving
  • git 常用命令之 git branch
  • Oracle数据泵
  • ACWING寒假每日一题python
  • 御黑行动来袭--助力三月重保,构筑安全防线!