当前位置: 首页 > news >正文

数据集归一化

一、介绍

图像归一化是计算机视觉和深度学习中的核心预处理步骤,旨在通过调整像素值范围或分布,提升模型训练的稳定性、收敛速度和泛化能力。

二、归一化的数学原理与方法

1. Min-Max归一化(线性缩放)

原理​​:将像素值线性映射到指定区间(如 [0, 1] 或 [-1, 1])。
在这里插入图片描述
作用​​:消除量纲差异,保留原始像素相对关系。

代码实现​​:

import cv2
import numpy as np
img = cv2.imread('image.jpg').astype(np.float32)
normalized = (img - img.min()) / (img.max() - img.min())  # 映射到 [0,1]

2. ​​Z-Score标准化(标准差归一化)​

原理​​:使数据符合标准正态分布(均值为0,标准差为1):
在这里插入图片描述
μ:所有像素均值,σ:标准差。
作用​​:解决数据分布偏斜问题,适用于对分布敏感的模型(如SVM、神经网络)。

代码实现​​:

mean = np.mean(img)
std = np.std(img)
standardized = (img - mean) / std

3. 非线性归一化​

Sigmoid 归一化​​:
在这里插入图片描述
作用​​:将像素值压缩到 (0, 1) 区间,适用于需要非线性变换的场景(如激活函数预处理)。

​​L2 归一化​​:
作用​​:按像素向量单位化,常用于特征提取后的降维处理。

三、归一化的必要性

1. 加速模型收敛​

归一化后梯度下降更稳定,避免参数震荡,缩短训练时间。

2. 提升模型鲁棒性​

减少光照、对比度差异对特征提取的影响,提高泛化能力。

3. 避免数值溢出​

防止大范围像素值导致计算溢出(如Sigmoid函数输入过大时饱和)。

4. ​​统一数据尺度​

在多通道或混合数据源场景下,确保各通道平等参与计算。

http://www.lryc.cn/news/606108.html

相关文章:

  • 机器学习之逻辑回归(Logistic Regression)
  • 视觉图像处理中级篇 [2]—— 外观检查 / 伤痕模式的原理与优化设置方法
  • 【支持Ubuntu22】Ambari3.0.0+Bigtop3.2.0——Step5—Nginx安装
  • Qt 常用控件 - 3
  • vue-seamless-scroll 与 echarts 三联水球图循环滚动的渲染难题-出现短暂空白
  • iOS高级开发工程师面试——其他
  • Linux大页内存导致服务内存不足
  • Java——方法
  • 基于R语言地理加权回归、主成份分析、判别分析等空间异质性数据分析实践技术应用
  • EEG手工特征提取总结
  • RagFlow本地源码部署(非Docker)
  • 现在有哪些广泛使用的时序数据库?
  • AWS高级解决方案架构师黄海波:GenAI 时代非结构化数据处理的实践与趋势洞察
  • Linux性能检测与调优
  • 解决SparkSQL创建出来的数据库hive中无法识别的问题
  • 切割液性能智能调控系统与晶圆 TTV 预测模型的协同构建
  • toFixed()方法的报错注意
  • Python 程序设计讲义(47):组合数据类型——字典类型:创建字典
  • MySQL常用函数总结
  • 2025年7月最新一区SCI-基尔霍夫定律优化算法Kirchhoff’s law algorithm-附Matlab免费代码
  • [硬件电路-109]:模拟电路 - 自激振荡器的原理,一种把直流能量转换成交流信号的装置!
  • 专题:2025半导体行业研究报告:从AI芯片到封测突围的生死局|附40+份报告PDF、数据汇总下载
  • Apifox 7 月更新|通过 AI 命名参数及检测接口规范、在线文档支持自定义 CSS 和 JavaScript、鉴权能力升级
  • 鸿蒙拉起系统定位和app授权定位
  • 光伏热斑误检率↓79%!陌讯多模态融合算法在智慧能源的落地优化
  • 当文档包含图文混排表格时,如何结合大模型(如DeepSeek-VL)和OCR提取数据
  • 一次 web 请求响应中,通常那个部分最耗时?
  • Flutter module 是如何被原生 Android 项目通过 Gradle 引入的
  • Flutter Chen Generator - yaml配置使用
  • 原生安卓与flutter混编的实现