当前位置: 首页 > news >正文

Min-Max标准化​ 和 ​Z-score标准化

1. 核心公式对比

标准化方法计算公式关键参数
Min-Max标准化

最小值、最大值
Z-score标准化

均值(μ)、标准差(σ)

2. 核心区别

​(1) 数据分布影响
维度Min-Max标准化Z-score标准化
输出范围固定到 [0, 1] 或自定义范围(如[-1,1])无固定范围(可能超出[-3,3])
极值敏感性对异常值敏感(极大/小值直接影响分母)对异常值鲁棒性强
分布形状保持原始分布形状转换为均值为0、标准差1的分布

示例​:
假设原始数据 [1, 2, 3, 100](100是异常值):

  • Min-Max结果:[0, 0.01, 0.02, 1](异常值导致其他数据被压缩接近0)
  • Z-score结果:[-0.68, -0.66, -0.64, 1.98](异常值影响较小)
​(2) 数学性质
性质Min-Max标准化Z-score标准化
均值无固定均值转换后均值=0
标准差无固定标准差转换后标准差=1
线性变换是(等比缩放+平移)是(平移+缩放)

3. 应用场景对比

场景推荐方法原因
图像处理(像素归一化)Min-Max需固定到[0,1]或[0,255]范围
机器学习(SVM、KNN)Min-Max基于距离的算法需要统一量纲
统计分析(假设检验)Z-score便于比较不同分布的数据(如考试分数与身高)
存在异常值的数据Z-score避免极值对标准化结果的扭曲
深度学习(神经网络输入)两者均可Min-Max更常见,但Z-score对ReLU激活函数更友好


5. 优缺点总结

方法优点缺点
Min-Max结果直观,范围固定受异常值影响大
Z-score保留数据分布特性,兼容异常值结果范围不固定,解释性稍弱

6. 如何选择?​

  • 选 ​Min-Max​ 如果:
    • 需要严格限定范围(如RGB像素值)
    • 数据分布均匀且无极端异常值
  • 选 ​Z-score​ 如果:
    • 数据存在潜在异常值
    • 需要与其他数据集进行分布比较(如不同单位的指标)

特殊技巧​:对异常值较多的数据,可先用IQR剔除异常值后再Min-Max标准化

http://www.lryc.cn/news/601367.html

相关文章:

  • Python队列算法:从基础到高并发系统的核心引擎
  • LeetCode|Day27|70. 爬楼梯|Python刷题笔记
  • Spring Retry 异常重试机制:从入门到生产实践
  • Spring Boot自动配置原理深度解析
  • 适配IE11(通过Babel+core-js转译ES6语法)
  • Flutter 生命周期介绍
  • 几个注册中心的特性
  • 欧拉图与欧拉回路
  • 菜鸟的C#学习(四)
  • windows 10安装oracle(win64_11gR2)
  • 医疗AI语义潜空间分析研究:进展与应用
  • Unity 实时 CPU 使用率监控
  • IP--MGER综合实验报告
  • Linux驱动20 --- FFMPEG视频API
  • 回归预测 | MATLAB实现BiTCN双向时间卷积神经网络多输入单输出回归预测
  • AWS免费套餐全面升级:企业降本增效与技术创新解决方案
  • 《频率之光》
  • 详解赛灵思SRIO IP并提供一种FIFO封装SRIO的收发控制器仿真验证
  • 基于Django的天气数据可视化分析预测系统
  • Django实时通信实战:WebSocket与ASGI全解析(下)
  • 二、搭建springCloudAlibaba2021.1版本分布式微服务-Nacos搭建及服务注册和配置中心
  • mybatis的insert(pojo),会返回pojo吗
  • 激光SLAM技术综述(2025版)
  • springboot基于Java的人力资源管理系统设计与实现
  • Windows 11 安装 jdk 8
  • QT开发---网络编程下
  • 全面理解JVM虚拟机
  • Python day26
  • Python数据分析基础(一)
  • 沪深L2逐笔十档委托队列分时Tick历史数据分析处理