当前位置: 首页 > article >正文

【数字图像处理】_笔记

第一章 概述


1.1 什么是数字图像?

     图像分为两大类:模拟图像与数字图像

  •      模拟图像:通过某种物理(光、电)的强弱变化来记录图像上各个点的亮度信息

                连续:从空间上和数值上是不间断的
                举例:胶卷照片、纸质照片、肉眼看见的图像

  •       数字图像:模拟图像经过采样和量化后得到的图像

               数字化意味着数字图像只是真实图像的近似,在数字化过程有信息损失(是为了方便计算机处理才做的采样和量化)
               举例:数码相机储存的图像
               像素值通常表示灰度、颜色、不透明度等

        图像的采样量化是数字图像处理的两个基本步骤,主要用于将模拟图像(如自然世界中的连续图像)转换为数字图像(即计算机可处理的图像)

一、采样(Sampling)

定义:

        采样是指在图像的空间域中对连续图像进行空间上的离散化,也就是在图像中选取一些特定的位置(点)来代表整个图像。

通俗理解:
        就像你拿相机拍照,感光元件上每个像素点都在采集一个位置的信息,最终得到一张由很多像素点组成的图像。

举例说明:

  • 一幅图像的分辨率是 1920×1080,这表示图像在水平方向被采样了1920次,垂直方向采样了1080次。

  • 如果采样率低,图像就会显得模糊、马赛克严重。


二、量化(Quantization)

定义:
        量化是指将每个采样点的像素值(通常是灰度值或颜色值)从连续的模拟值转化为有限的离散数值等级

通俗理解:
        现实世界中的亮度、颜色变化是连续的,但计算机只能表示有限数量的数字。因此必须把这些连续值四舍五入到最近的离散值。

举例说明:

  • 灰度图像中,如果使用8位来表示灰度值,就有 2^8 = 256个灰度等级。

  • 如果量化等级太少(如只用2位=4个灰度级),图像就会出现色带(伪影),失去细节。

三、采样 vs 量化 对比

  • 项目采样量化
    涉及的维度空间维度(横纵坐标)灰度或颜色值
    作用选取图像中的像素点将每个像素值转化为整数级别
    结果影响图像的分辨率影响图像的灰度层次或色彩精度

拍照时,“你拍了多少个点”是采样,“你对每个点的颜色记录得有多精细”是量化。

1.2数字图像处理的基本流程

  1. 图像获取

     通过传感器(如相机、扫描仪、MRI设备)将现实世界的模拟图像转换为数字信号(采样+量化)。
  2. 预处理

     增强:调整对比度、降噪、锐化(如直方图均衡化、滤波)。                                              校正:消除几何畸变、色彩偏差(如镜头畸变修正)。
  3. 特征提取

    检测边缘、纹理、形状或特定目标(如SIFT特征、霍夫变换)。
  4. 分析与识别

    分类(如人脸识别)、分割(如医学图像中的肿瘤区域)、测量(如细胞计数)。
  5. 输出与可视化

    生成处理后的图像、数据报告或控制指令(如自动驾驶中的障碍物标记)。

1.3 数字图像处理的发展趋势

Ø 从低分辨率向高分辨率发展
Ø 从二维(2D)向三维(3D)发展
Ø 从静止图像向动态图像发展
Ø 从单态图像向多态图像发展
Ø 从图像处理向图像理解发展

第二章 基础知识

2.1 图像的数字化

  • 采样 →M*N矩阵
  • 量化→连续函数f(x,y)被划分为K个空间
  • 采样及量化越精细(M,N,K越大),越逼近连续图像

2.2 图像的表示

2.3 图像模式及彩色模型

图像模式:

     二值图像:指图像中的每个像素点只有 两种可能的取值(通常为 0 和 1),分别对应 黑色 和 白色(或其他两种颜色的组合)。
     灰度图像灰度图像中每个像素点的取值表示 亮度(明暗程度),通常范围为 0(黑色)到 255(白色),共 256 级灰度(8 位二进制数。   灰度图像可以保留亮度信息:能体现图像的明暗层次,但不包含颜色信息。

     彩色图像:彩色图像通过不同颜色通道的组合来表示像素的颜色。每个像素通常占用 3 字节(RGB 三通道各 1 字节),存储和处理成本较高。


常用的彩色模型:

彩色模型(颜色空间)用于以数学方式描述颜色。

1. RGB(Red, Green, Blue)

  • 原理:基于光的三原色叠加(加色模型)。

  • 表示

    • 三维坐标 (R, G, B),每通道范围通常为 0~255(8位)。

    • 黑色(0, 0, 0)白色(255, 255, 255)。、

  • 特点

    • 直接对应显示器/传感器的物理输出。

    • 颜色与亮度耦合,调整单一通道会影响亮度和色相。

    • 等比例混合时(如 R=G=B)呈现灰度色(如 R=G=B=128 为灰色)。

2.HSI 彩色模型(Hue-Saturation-Intensity)

原理

  • 基于人类视觉感知:将颜色分解为三个直观的分量:
    • 色调(Hue, H):颜色的种类(如红、绿、蓝),取值范围通常为 0°-360°(对应色轮圆周)。
    • 饱和度(Saturation, S):颜色的纯度(鲜艳程度),取值范围 0%-100%(0% 为灰度色,100% 为纯色)。
    • 亮度(Intensity, I):颜色的明暗程度,取值范围 0%-100%(0% 为黑色,100% 为白色)。
      亮度定义三通道平均值(Intensity,平均亮度)

特点

  • 解耦颜色属性:H、S、I 三个分量相互独立,便于单独调整(如调节亮度不影响色调)。
  • 与 RGB 可相互转换:通过数学公式实现转换,但计算复杂度较高。

3.HSV 彩色模型(Hue-Saturation-Value)

  • RGB:基于光的三原色叠加,适用于显示器存储。

  • HSV:基于人眼感知,分离色相(H)饱和度(S)明度(V),更适合颜色调整和图像分析。

原理

  • 类似 HSI 的变体
    • 色调(H):与 HSI 的 H 含义相同(0°-360°)。
    • 饱和度(S):与 HSI 的 S 含义相同(0%-100%)。
    • 明度(Value, V):对应颜色的 最大亮度(与 HSI 的亮度 I 略有差异),取值范围 0%-100%(0% 为黑色,100% 为纯色最亮状态)
亮度定义三通道最大值(Value,最大亮度

4.YCrCb(Luminance-Chrominance)

  • 原理:分离亮度(Y)和色度(Cr, Cb),基于人眼对亮度更敏感的特性。

  • 表示

    • Y:亮度(类似灰度)。

    • Cr:红色分量与亮度的差值。

    • Cb:蓝色分量与亮度的差值。

  • 特点

    • 色度信息可压缩(如JPEG压缩时降低Cr/Cb分辨率)。

    • 兼容黑白显示(仅需Y通道)

 5.Lab 彩色模型(CIE L*a*b*)

原理

  • 设备无关的感知模型:由国际照明委员会(CIE)定义,基于人类视觉的 均匀颜色空间,理论上能覆盖人眼可见的所有颜色。
  • 三个分量
    • L(亮度):取值范围 0-100(0 为黑色,100 为白色)。
    • a(红绿轴):取值范围 -128-127(负值为绿色,正值为红色)。
    • b(蓝黄轴):取值范围 -128-127(负值为蓝色,正值为黄色)。

特点

  • 最接近人类视觉:颜色空间均匀分布,任意两点间的欧氏距离对应人眼感知的颜色差异(ΔE 值)。
  • 色域最广:包含 RGB 和 CMYK 无法表示的颜色(如某些鲜艳的青色)

✅ 总结对比表

模型构成应用领域优点
RGBR, G, B显示设备,原始图像输入硬件友好,处理简单
HSIHue, Sat, Int图像识别、分析直观反映人类感知
HSV/HSBHue, Sat, Value图像编辑、调色板易于调色,图形用户界面常用
YCrCbY, Cr, Cb视频压缩、传输分离亮度和色度,便于压缩
LabL, a, b图像增强、颜色差异检测感知均匀、设备无关

2.4 像素之间的关系

http://www.lryc.cn/news/2386656.html

相关文章:

  • 从0开始学习R语言--Day10--时间序列分析数据
  • 基于开源链动2+1模式AI智能名片S2B2C商城小程序的产品驱动型增长策略研究
  • 每日算法 -【Swift 算法】反转整数的陷阱与解法:Swift 中的 32 位整数处理技巧
  • 使用 OpenCV 实现“随机镜面墙”——多镜片密铺的哈哈镜效果
  • 鸿蒙仓颉开发语言实战教程:页面跳转和传参
  • 如何在Vue中实现延迟刷新列表:以Element UI的el-switch为例
  • 最新Spring Security实战教程(十六)微服务间安全通信 - JWT令牌传递与校验机制
  • MDM在智能健身设备管理中的技术应用分析
  • OSPF ABR汇总路由
  • 【五】Spring Cloud微服务开发:解决版本冲突全攻略
  • Spring Boot微服务架构(二):开发调试常见中文问题
  • Linux基础IO----动态库与静态库
  • LeetCode百题刷004(哈希表优化两数和问题)
  • 解析Java String.getBytes()编码与new String()解码的字符集转换机制
  • 从万有引力到深度学习,认识模型思维
  • 2022 年 9 月青少年软编等考 C 语言八级真题解析
  • FPGA通信之VGA与HDMI
  • Leetcode百题斩-二叉树
  • 修改 K8S Service 资源类型 NodePort 的端口范围
  • ACM Latex模板:合并添加作者和单位
  • 爬虫IP代理技术深度解析:场景、选型与实战应用
  • 将MCP(ModelContextProtocol)与Semantic Kernel集成(调用github)
  • 游戏引擎学习第311天:支持手动排序
  • LambdaQueryWrapper、MybatisPlus提供的基本接口方法、增删改查常用的接口方法、自定义 SQL
  • 深度学习---可视化
  • 军事大模型及其应用分析
  • c++算法题
  • 云原生安全 SaaS :从基础到实践
  • 《Drain日志解析算法》论文阅读笔记
  • MMAction2重要的几个配置参数