当前位置：首页 > news >正文

数据集归一化

news 2025/8/2 14:06:58

一、介绍

图像归一化是计算机视觉和深度学习中的核心预处理步骤，旨在通过调整像素值范围或分布，提升模型训练的稳定性、收敛速度和泛化能力。

二、归一化的数学原理与方法

1. Min-Max归一化（线性缩放）

原理：将像素值线性映射到指定区间（如 [0, 1] 或 [-1, 1]）。
在这里插入图片描述
作用：消除量纲差异，保留原始像素相对关系。

代码实现：

import cv2
import numpy as np
img = cv2.imread('image.jpg').astype(np.float32)
normalized = (img - img.min()) / (img.max() - img.min())  # 映射到 [0,1]

2. Z-Score标准化（标准差归一化）

原理：使数据符合标准正态分布（均值为0，标准差为1）：
在这里插入图片描述
μ：所有像素均值，σ：标准差。
作用：解决数据分布偏斜问题，适用于对分布敏感的模型（如SVM、神经网络）。

代码实现：

mean = np.mean(img)
std = np.std(img)
standardized = (img - mean) / std

3. 非线性归一化

Sigmoid 归一化：
在这里插入图片描述
作用：将像素值压缩到 (0, 1) 区间，适用于需要非线性变换的场景（如激活函数预处理）。

L2 归一化：
作用：按像素向量单位化，常用于特征提取后的降维处理。

三、归一化的必要性

1. 加速模型收敛

归一化后梯度下降更稳定，避免参数震荡，缩短训练时间。

2. 提升模型鲁棒性

减少光照、对比度差异对特征提取的影响，提高泛化能力。

3. 避免数值溢出

防止大范围像素值导致计算溢出（如Sigmoid函数输入过大时饱和）。

4. 统一数据尺度

在多通道或混合数据源场景下，确保各通道平等参与计算。

查看全文

http://www.lryc.cn/news/606108.html

机器学习之逻辑回归（Logistic Regression)

视觉图像处理中级篇 [2]—— 外观检查 / 伤痕模式的原理与优化设置方法

【支持Ubuntu22】Ambari3.0.0+Bigtop3.2.0——Step5—Nginx安装

Qt 常用控件 - 3

vue-seamless-scroll 与 echarts 三联水球图循环滚动的渲染难题-出现短暂空白

iOS高级开发工程师面试——其他

Linux大页内存导致服务内存不足

Java——方法

基于R语言地理加权回归、主成份分析、判别分析等空间异质性数据分析实践技术应用

EEG手工特征提取总结

RagFlow本地源码部署(非Docker)

现在有哪些广泛使用的时序数据库？

AWS高级解决方案架构师黄海波：GenAI 时代非结构化数据处理的实践与趋势洞察

Linux性能检测与调优

解决SparkSQL创建出来的数据库hive中无法识别的问题

切割液性能智能调控系统与晶圆 TTV 预测模型的协同构建

toFixed()方法的报错注意

Python 程序设计讲义（47）：组合数据类型——字典类型：创建字典

MySQL常用函数总结

[硬件电路-109]：模拟电路 - 自激振荡器的原理，一种把直流能量转换成交流信号的装置！

专题：2025半导体行业研究报告：从AI芯片到封测突围的生死局|附40+份报告PDF、数据汇总下载

Apifox 7 月更新｜通过 AI 命名参数及检测接口规范、在线文档支持自定义 CSS 和 JavaScript、鉴权能力升级

鸿蒙拉起系统定位和app授权定位

光伏热斑误检率↓79%！陌讯多模态融合算法在智慧能源的落地优化

当文档包含图文混排表格时，如何结合大模型（如DeepSeek-VL）和OCR提取数据

一次 web 请求响应中，通常那个部分最耗时？

Flutter module 是如何被原生 Android 项目通过 Gradle 引入的

Flutter Chen Generator - yaml配置使用

原生安卓与flutter混编的实现

一、介绍

二、归一化的数学原理与方法

1. Min-Max归一化（线性缩放）

2. ​​Z-Score标准化（标准差归一化）​

3. 非线性归一化​

三、归一化的必要性

1. 加速模型收敛​

2. 提升模型鲁棒性​

3. 避免数值溢出​

4. ​​统一数据尺度​