当前位置: 首页 > news >正文

【音视频|wav】wav音频文件格式详解

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀
🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭
🤣本文内容🤣:🍭介绍wav音频格式🍭
😎金句分享😎:🍭子曰:父母在,不远游,游必有方。 ——《论语·里仁篇》。意思是,父母还健在时,就不要远离他们,如果一定要出远门,也必须告知自己所去的地方。🍭

目录

  • 🎄一、概述
  • 🎄二、wav 文件结构
    • ✨2.1 RIFF 规范
    • ✨2.2 wav 文件结构
  • 🎄三、PCM 转 WAV 的C语言程序
  • 🎄四、总结


在这里插入图片描述

🎄一、概述

WAV全称是 Waveform Audio File Format,是一种常用的无损音频文件格式,它最初由微软和IBM于1991年共同开发,并成为Windows操作系统中音频文件的标准格式之一。从文件结构来讲,WAV文件格式是微软存储多媒体文件的RIFF规范的子集。本文将详细介绍WAV格式文件的文件结构。

WAV格式文件相对于其他音频文件格式具有以下特点:

  • 无损压缩:WAV文件采用无损压缩算法,不会丢失原始音频数据,能够保留音频的高质量。
  • 高音质:由于无损压缩技术的使用,WAV文件通常具有较高的音质和更好的还原性能。
  • 大文件大小:由于不进行任何压缩,WAV文件相对于其他压缩格式(如MP3)的文件大小较大,占用存储空间较多。
  • 支持多种采样率和位深度:WAV文件支持多种采样率和位深度,可以根据需求选择合适的参数进行录制或处理。
  • 广泛兼容性:WAV格式是一种通用的音频文件格式,几乎所有的音频软件和硬件设备都能够支持读取和播放WAV文件。

在这里插入图片描述

🎄二、wav 文件结构

WAV 文件采用RIFF规范来存储音频数据和相关元信息。这小节我们先了解RIFF规范,然后介绍wav文件的组成部分。

✨2.1 RIFF 规范

RIFF(Resource Interchange File Format)是一种通用的文件格式规范,最初由微软开发,用于在不同应用程序之间交换数据。它以分块的方式组织数据,每个块包含一个标识符和相应的数据内容。

在音视频领域中,wav文件avi文件 都使用了RIFF规范来存储数据。

✨2.2 wav 文件结构

WAV文件通常是一个RIFF文件,整个文件由 44个字节的文件头+音频数据 构成。

这个文件头分为三个部分:RIFF块(下图紫色部分)、指定数据格式的fmt块(下图绿色部分)、包含实际样本数据的data块(下图砖红色部分)。

在这里插入图片描述

  • RIFF块:
    • 1、ChunkID:包含ASCII格式的字母RIFF
    • 2、ChunkSize:这个数值ChunkSize后面所有数据的大小。可以是整个文件的大小减去8个字节;也可以是36+SubChunk2Size;还可以是4 + (8+SubChunk1Size) + (8+SubChunk2Size)
    • 3、Format:包含字母WAVE

  • fmt块:
    • Subchunk1ID:包含字母fmt,表示fmt块;
    • Subchunk1Size:这个数值是Subchunk1Size后所有fmt块数据的大小,对于PCM数据来说,这个值固定为16;
    • AudioFormat:如果音频数据是PCM,这个值为 11 以外的值表示一些压缩形式;
    • NumChannels:声道数,Mono = 1, Stereo = 2 等等;
    • SampleRate:采样率,8000,44100,48000 等;
    • ByteRate:每秒的字节数,采样率 * 声道数 * 样本位数 / 8
    • BlockAlign:每个声道取一个样本的字节数之和,声道数 * 样本位数 / 8
    • BitsPerSample:样本位数,每个样本占用的bit位个数。8bit、16bit 等等。

  • data块:
    • Subchunk2ID:包含字母data,表示data块;
    • Subchunk2Size:这个数值是Subchunk2Size后所有数据的字节数,也就是实际音频数据的总字节数。
    • Data:实际的音频数据;

在这里插入图片描述

🎄三、PCM 转 WAV 的C语言程序

// pcm2wac.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>/*** Convert PCM16LE raw data to WAVE format* @param pcmpath      Input PCM file.* @param channels     Channel number of PCM file.* @param sample_rate  Sample rate of PCM file.* @param wavepath     Output WAVE file.*/
int simplest_pcm16le_to_wave(const char *pcmpath,int channels,int sample_rate,const char *wavepath)
{typedef struct WAVE_HEADER{  char         fccID[4];        unsigned   int    dwSize;            char         fccType[4];    }WAVE_HEADER;  typedef struct WAVE_FMT{  char         fccID[4];        unsigned   int       dwSize;            unsigned   short     wFormatTag;    unsigned   short     wChannels;  unsigned   int       dwSamplesPerSec;  unsigned   int       dwAvgBytesPerSec;  unsigned   short     wBlockAlign;  unsigned   short     uiBitsPerSample;  }WAVE_FMT;  typedef struct WAVE_DATA{  char       fccID[4];          unsigned int dwSize;              }WAVE_DATA;  if(channels==0||sample_rate==0){channels = 2;sample_rate = 44100;}int bits = 16;WAVE_HEADER   pcmHEADER;  WAVE_FMT   pcmFMT;  WAVE_DATA   pcmDATA;  unsigned   short   m_pcmData;FILE   *fp,*fpout;  fp=fopen(pcmpath, "rb");if(fp == NULL) {  printf("open pcm file error\n");return -1;  }fpout=fopen(wavepath,   "wb+");if(fpout == NULL) {    printf("create wav file error\n");  return -1; }        //WAVE_HEADERmemcpy(pcmHEADER.fccID,"RIFF",strlen("RIFF"));                    memcpy(pcmHEADER.fccType,"WAVE",strlen("WAVE"));  fseek(fpout,sizeof(WAVE_HEADER),1); //WAVE_FMTpcmFMT.dwSamplesPerSec=sample_rate;  pcmFMT.dwAvgBytesPerSec=pcmFMT.dwSamplesPerSec*sizeof(m_pcmData);  pcmFMT.uiBitsPerSample=bits;memcpy(pcmFMT.fccID,"fmt ",strlen("fmt "));  pcmFMT.dwSize=16;  pcmFMT.wBlockAlign=2;  pcmFMT.wChannels=channels;  pcmFMT.wFormatTag=1;  fwrite(&pcmFMT,sizeof(WAVE_FMT),1,fpout); //WAVE_DATA;memcpy(pcmDATA.fccID,"data",strlen("data"));  pcmDATA.dwSize=0;fseek(fpout,sizeof(WAVE_DATA),SEEK_CUR);fread(&m_pcmData,sizeof(unsigned short),1,fp);while(!feof(fp)){  pcmDATA.dwSize+=2;fwrite(&m_pcmData,sizeof(unsigned short),1,fpout);fread(&m_pcmData,sizeof(unsigned short),1,fp);}  pcmHEADER.dwSize=44+pcmDATA.dwSize;rewind(fpout);fwrite(&pcmHEADER,sizeof(WAVE_HEADER),1,fpout);fseek(fpout,sizeof(WAVE_FMT),SEEK_CUR);fwrite(&pcmDATA,sizeof(WAVE_DATA),1,fpout);fclose(fp);fclose(fpout);return 0;
}int main()
{simplest_pcm16le_to_wave("48000Hz-s16le-2ch-ChengDu.pcm",2,48000,"output_nocturne.wav");return 0;
}

代码来自:https://blog.csdn.net/leixiaohua1020/article/details/50534316

在这里插入图片描述

🎄四、总结

本文详细介绍wav音频文件的结构,以及提供了pcm转wav的C语言代码。

在这里插入图片描述
如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁

参考资料:
WAVE PCM soundfile format
视音频数据处理入门:PCM音频采样数据处理
https://blog.csdn.net/xianrenli38/article/details/93621344

http://www.lryc.cn/news/211853.html

相关文章:

  • 网络工程综合试题(二)
  • Android JNI/NDK 入门从一到二
  • 吃瓜教程3|决策树
  • springboot动态数据源【非伪数据源】
  • 如何改善设备综合效率(OEE)并提高工厂的生产力
  • 一文接入Android阿里Sophix热更新
  • 【高阶数据结构】并查集和图
  • Git 提交时提示 GPG 签名错误
  • vite+vue3实现 tomcat 的本地部署
  • docker+playwright
  • php框架路由实现
  • 在CentOS 7中手工打造和运行xml文件配置的Servlet,然后使用curl、浏览器、telnet等三种工具各自测试
  • 单例模式.
  • 2023年MathorCup高校数学建模挑战赛大数据挑战赛赛题浅析
  • c++小惊喜——stringstream
  • ubuntu 18.04 编译安装flexpart 10.4(2023年) —— 筑梦之路
  • 深度学习(生成式模型)——DDIM:Denoising Diffusion Implicit Models
  • HashMap的遍历方式 -- 好几次差点记不起来总结了一下
  • PostgreSQL 两表关联更新sql
  • R2R 的一些小tip
  • UML中类之间的六种主要关系
  • 机器学习-朴素贝叶斯之多项式模型
  • 下载的nginx证书转换成tomcat证书格式
  • 计算机毕业设计选题推荐-社区志愿者服务微信小程序/安卓APP-项目实战
  • ES6中数值扩展
  • sql-50练习题11-15
  • 【多线程面试题十九】、 公平锁与非公平锁是怎么实现的?
  • 3.4每日一题(变量可分离方程通解)
  • LabVIEW背景颜色设为和其他程序或图像中一样
  • 图表参考线,数据对比一目了然_三叠云