当前位置: 首页 > news >正文

P4 音频知识点——PCM音频原始数据

目录

 前言

01 PCM音频原始数据

1.1 频率 

1.2 振幅:

1.3 比特率

1.4 采样

1.5 量化

1.6 编码

02. PCM数据有以下重要的参数:

采样率:

采集深度

 通道数

​​​​​​​ PCM比特率

​​​​​​​ PCM文件大小计算:

​​​​​​​ PCM存储格式​​​​​​​


 前言

                             

从本章开始我们将要学习嵌入式音视频的学习了 ,使用的瑞芯微的开发板

🎬 个人主页:@ChenPi

🐻推荐专栏1: 《C++_@ChenPi的博客-CSDN博客》✨✨✨ 

🔥 推荐专栏2: 《Linux C应用编程(概念类)_@ChenPi的博客-CSDN博客》✨✨✨

🛸推荐专栏3:《嵌入式音视频_@ChenPi的博客-CSDN博客》
🌺本篇简介  :这章记录音频的基础知识学习

01 PCM音频原始数据

音频原始数据PCM,PCM全称是脉冲编码调制数据。PCM数据是未经过压缩的音频数据,它是由模拟信号经过采样、编码等步骤转换成标准的数字信号。

1.1 频率 

频率:声音的频率,我们人类的所听到的声音频率范围大概在20hz-20khz

1.2 振幅:

振幅:指的是声音的响度,也就是我们常说的高低音

1.3 比特率

 比特率:代表的是音频未经过压缩的数据,每秒需要传输的数据量,它的公式是:

采样率*采样深度*通道数

1.4 采样

采样:采样是我们音频最重要的知识点之一,它指的是把一段连续的模拟信号转换成离散的数字信号。而采样率就指的是每秒钟采样的个数,而根据奈奎斯特采样公式:当采样率大于等于连续信号的2倍时,采样信号就能够无差别还原出原始的信号。比方说人类的听觉频率是20HZ-20KHZ,而采样率就需要达到40KHZ以上才能够保证数据的完整性。

  

1.5 量化

量化:量化指的是在坐标轴上,把每一个离散数据进行数字化操作。换言之就是把我们每一个采样的点都按照数字化表示出来,如下图

  

从这张图我们可以看出,量化的过程就是把刚才我们转换成的数字信号一个一个点用竖线显示出来,这样的话我们在数字化的时候就方便很多。

1.6 编码

编码:把每一个量化的采样点存储起来,并以二进制的形式表现出来的过程就是编码。下图就是存储的表格:

  

把上图所有的数据存储起来,就是一段连续的PCM数据。

PCM数据,二进制形式:

011011110111101……

对于一个音频的原始数字信号的生成:

采集->采样->量化->编码:->PCM数据

02. PCM数据有以下重要的参数

采样率:

​​​​​​​ 采样率:指的是每秒钟采样的个数,换言之就是1S钟采集声音的频率,比方说48000HZ就相当于一秒钟PCM采集48000个。PCM数据常用的采样率有:

  1. 192000HZ:192KHZ(蓝光、高清电影DVD)
  2. 96000HZ 96KHZ(蓝光、高清电影DVD)
  3. 48000HZ48KHZ(数字电视、DVD)  (最常用)
  4. 44100HZ:44.1KHZ(CD音质)
  5. 22000HZ:22KHZ(无线广播)

采集深度

采样深度:每次采样的大小,比方说如果采样深度是16BIT

那声音就有2的16次方的振幅,而32bit就相当于有2的32次方个振幅。

声音振幅越多,声音的质量就会越高。

在PCM中,有三种常见的采样大小:

8 BIT16BIT32BIT(FLTP)

​​​​​​​ 通道数

PCM一般有四种通道数:

 单声道:

指的是只有一个声音的通道,比方说电话、喇叭之类的

双声道(立体声)

双声道指的是有两个声音的通道,声音在录制的过程中分配到两个独立的声道,这让人听起来就有立体的感觉。

四声道:

四声道指的是前左、前右、后左、后右四个发声通道。观众听起来,则像被声音包围了一样。

声道:

5.1声道广泛运用在家庭影院 

​​​​​​​ PCM比特率

比特率指的是每秒传输的比特数(bit),一般PCM的比特率计算公式是:

采样率*采样深度*通道数

比如:48000 * 16 * 2 = 1536000

​​​​​​​ PCM文件大小计算:

假设一个PCM音频设备采样率48000、采样精度是16bit、2通道,大概采集10分钟数据,那它的大小:采样率 * 采样深度 * 通道数 * 时长 = 48000 * 16 * 2 * 10 * 60 = 921600000bit,然后再把bit转换成字节(BYTE) 921 600 000/8/1024/1024 = 109M

​​​​​​​ PCM存储格式

    

上图是PCM单双声道的存储布局,这里我们来重点讲解一下双声道的布局。

一般双声道的存储有两种存储方式,一种是交错模式、另外一种是非交错模式。

  • 交错模式:首先记录第一帧的左声道样本和右声道样本
  • 非交错模式:首先先记录一个周期内所有帧的左声道样本、再记录所有右声道样本

交错模式:L R L R L R L R

非交错模式:L L L L L R R R

此篇文章来源于B站博主——飞一样的成长

http://www.lryc.cn/news/266477.html

相关文章:

  • 解决Electron中WebView加载部分HTTPS页面白屏的方法
  • 【Java中创建对象的方式有哪些?】
  • npm使用详解(好吧好吧是粗解)
  • uniapp自定义头部导航怎么实现?
  • 什么是 Dubbo?它有哪些核心功能?
  • (2021|CoRR,AugCLIP,优化)FuseDream:通过改进的 CLIP+GAN 空间优化实现免训练文本到图像生成
  • python pip安装依赖的常用软件源
  • 避免大M取值过大引起的数值问题
  • 史密斯圆图的使用
  • 可重复读解决了哪些问题? 对 SQL 慢查询会考虑哪些优化 ?
  • 从0开始python学习-35.allure报告企业定制
  • 蓝桥杯2020年10月青少组Python程序设计省赛真题
  • 【数据结构】布隆过滤器原理详解及其代码实现
  • Qt中实现短信验证码功能
  • Redis-运维
  • Qt制作定时关机小程序
  • LeetCode day30
  • 数据分析基础之《numpy(5)—合并与分割》
  • centos 安装 Miniconda
  • 第二百二十六回
  • ubuntu常用指令
  • Quartz.NET 事件监听器
  • 2024-AI人工智能学习-安装了pip install pydot但是还是报错
  • 在使用mapstruct,想忽略掉List<DTO>字段里面的,`data` 字段的映射, 如何写ignore: 使用@IterableMapping
  • ansible-playbook的Temlates模块 tags模块 Roles模块
  • Canal使用详解
  • 【经典LeetCode算法题目专栏分类】【第8期】滑动窗口:最小覆盖子串、字符串排列、找所有字母异位词、 最长无重复子串
  • C#和.Net常见问题记录
  • FAQ:Container Classes篇
  • 每日一题(LeetCode)----栈和队列--滑动窗口最大值