当前位置: 首页 > news >正文

音视频学习(三十八):像素与位深

像素(Pixel)

  • 定义:图像的最小单元,是一个颜色点。

  • 图像分辨率 = 水平像素数 × 垂直像素数,例如:

    • 1920×1080 表示宽 1920、高 1080,总共约 207 万像素。
  • 每个像素可以包含:

    • 灰度图:一个亮度值(Y)
    • 彩色图:R、G、B(或 Y、Cb、Cr)
    • 有透明度时:还包括 Alpha 通道(A)

位深(Bit Depth)

  • 定义:每个通道用于存储颜色值的位数。

  • 常见位深

    位深每通道色彩等级用途
    8-bit256 等级(2⁸)最常见,视频压缩标准默认
    10-bit1024 等级(2¹⁰)HDR 视频、专业视频处理
    12-bit4096 等级(2¹²)高动态范围、电影制作
    16-bit65536 等级(2¹⁶)医学图像、科学计算等

示例:

  • 8-bit RGB:每个像素使用 8 × 3 = 24 bits(即 3 字节);
  • 10-bit YUV420:Y 用 10 位,U/V 通道也用 10 位,但是按 4:2:0 采样,整体压缩更高。

像素格式(Pixel Format)

在 FFmpeg / 视频编码中,“像素格式” 表示图像的颜色空间 + 位深 + 采样方式

像素格式位深色彩空间采样方式总体说明
yuv420p8-bitYUV4:2:0最常见,8-bit 标清/高清视频
yuv420p10le10-bitYUV4:2:0H.265/ProRes 支持,HDR 视频
rgb248-bitRGB每像素 3 字节,常用于图像处理
gray8-bit灰度单通道,适用于黑白摄像头
yuv422p8-bitYUV4:2:2高清广播、部分相机使用
yuv444p10le10-bitYUV4:4:4无色度压缩,颜色最保真

“le” 表示 little endian(小端序),多见于 x86 平台。

像素与位深的存储空间关系

举例说明:

1920×1080 yuv420p 8bit

  • Y 分量:1920×1080 × 8bit = ~2.07 Mb
  • U 分量:960×540 × 8bit = ~0.26 Mb
  • V 分量:960×540 × 8bit = ~0.26 Mb
  • 总体大小 ≈ 2.6 MB/帧

1920×1080 yuv420p10le

  • 每通道 10bit,用 16bit 对齐存储(占用 2 字节)
  • 总大小 ≈ 2 倍 8-bit,约 5.2 MB/帧

影响

项目影响
编码压缩效率位深越高越难压缩,码率也更高
色彩精度位深越高,颜色过渡越平滑,避免色带(banding)
HDR 支持需要至少 10-bit 才能支持 HDR10、Dolby Vision 等
GPU 加速解码GPU 对特定位深格式支持有限,如 10-bit 需要特定显卡
文件大小位深越高,文件体积越大

YUV与RGB

对比

格式颜色空间采样结构每像素通道数每像素颜色值来源
RGBR, G, B每像素独立 R、G、B3每像素完整色彩值
YUV420Y, U, V4:2:0 色度子采样1(Y)+ 0.25(U)+ 0.25(V)平均每像素有 1.5 通道值

计算方法

RGB24(8-bit RGB,每通道8bit)

每像素:

8bit(R) + 8bit(G) + 8bit(B) = 24 bits = 3 bytes

YUV420P(4:2:0 采样)

每 2×2 像素共用 1 个 U + 1 个 V,Y 每像素都有:

分量分辨率占比
YW × H100%
UW/2 × H/225%
VW/2 × H/225%

合计:

Y:   1 byte × W × H
U: 0.25 byte × W × H
V: 0.25 byte × W × H
总计 ≈ 1.5 byte × W × H

不同位深时存储量对比(以 1920×1080 为例)

格式位深每像素大小总帧大小 ≈
RGB2483 bytes1920×1080×3 = ~5.93 MB
RGB30104 bytes(对齐)1920×1080×4 = ~7.91 MB
YUV420P81.5 bytes1920×1080×1.5 = ~2.96 MB
YUV420P10102 bytes(对齐) × 1.5 = 3 bytes1920×1080×3 = ~5.93 MB

🔸 注意:10-bit 视频通常使用 16-bit 对齐(即每通道 2 字节)存储。

转换影响

从 RGB ➜ YUV420:

  • 颜色有损失,特别是高频色彩细节;
  • 视频压缩比更高,适合编码;
  • 通常用于图像转码、摄像头采集。

从 YUV420 ➜ RGB:

  • 还原近似颜色;
  • 解码时自动完成重建,但不能完全恢复原始 RGB 细节。

总结

属性像素(Pixel)位深(Bit Depth)
含义图像的最小单元每个颜色通道的位数
单位bit(比特)
控制什么图像/视频尺寸每像素能表示的颜色精度
示例1920×10808-bit、10-bit、12-bit
相关术语分辨率、采样率、像素格式色彩深度、HDR、采样位宽
http://www.lryc.cn/news/587069.html

相关文章:

  • Linux | 数据库操作基础
  • 【ROS2】自定义消息接口的创建和使用
  • # 通过wifi共享打印机只有手动翻页正反打印没有自动翻页正反打印,而通过网线连接的主机电脑可以自动翻页正反打印
  • 信息收集(外围打点)
  • 在上海开发小程序,怎么做出“高级感”?
  • sql:sql在office中的应用有哪些?
  • 机器学习sklearn入门:使用KNN模型分类鸢尾花和简单调参
  • Matplotlib(一)- 数据可视化与Matplotlib
  • 前端性能优化利器:懒加载技术原理与最佳实践
  • ADRC自抗扰控制—深度解析与实战指南2
  • 适配器模式:兼容不兼容接口
  • 《[系统底层攻坚] 张冬〈大话存储终极版〉精读计划启动——存储架构原理深度拆解之旅》-系统性学习笔记(适合小白与IT工作人员)
  • Redis数据类型之zset
  • 补:《每日AI-人工智能-编程日报》--2025年7月12日
  • Vue单文件组件与脚手架工程化开发
  • 小白学Python,操作文件和文件夹
  • 【王树森推荐系统】重排04:DPP 多样性算法(上)
  • leetGPU解题笔记(2)
  • CSAPP_第一章:计算机系统漫游读书笔记
  • 从文本中 “提取” 商业洞察“DatawhaleAI夏令营”
  • 通信子网 V
  • Java 内部类详解:从基础到实战,掌握嵌套类、匿名类与局部类的使用技巧
  • 一天速通TypeScript入门基础知识
  • Java反射机制深度解析
  • VsCode的LivePreview插件应用
  • 20250713-day14
  • UNet改进(22):融合CNN与Transformer的医学图像分割新架构
  • 板凳-------Mysql cookbook学习 (十一--------9)
  • ALB、NLB、CLB 负载均衡深度剖析
  • spring cloud负载均衡分析之FeignBlockingLoadBalancerClient、BlockingLoadBalancerClient