当前位置: 首页 > news >正文

机器学习sklearn入门:归一化和标准化

bg:归一化(Normalization)通常指将数据按比例缩放至某个特定范围,但具体范围并不一定是固定的 0到1。标准化是将数据转换成均值为0,标准差为1的分布。

使用场景:

  • 用归一化

    • 需要严格限定范围(如神经网络输入、图像处理)。

    • 数据分布均匀且无极端值。

  • 用标准化

    • 数据服从正态分布(或需要转换为正态分布)。

    • 算法假设数据均值为 0(如 PCA、线性回归、SVM)。

归一化

1、pandas构建二维数组

from sklearn.preprocessing import MinMaxScaler
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
import pandas as pd
pd.DataFrame(data)

2、实现归一化

scaler = MinMaxScaler() #实例化
scaler = scaler.fit(data) #fit,在这里本质是生成min(x)和max(x)
result = scaler.transform(data) #通过接口导出结果
result

--也可以使用fit_tranform一步到位

3、反归一化就用scaler.inverse_transform(result)

4、上面默认转换为0-1之间的数据,如果需要其它范围的就在实例化MinMaxScaler的时候加上参数feature_range

data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
scaler = MinMaxScaler(feature_range=[5,10]) 
result = scaler.fit_transform(data) #fit_transform一步导出结果
result

标准化

from sklearn.preprocessing import StandardScaler
data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
scaler = StandardScaler() #实例化
scaler.fit(data) #fit,本质是生成均值和方差
scaler.mean_ #查看均值的属性mean_
scaler.var_ #查看方差的属性var_
x_std = scaler.transform(data) #通过接口导出结果
x_std.mean() #导出的结果是一个数组,用mean()查看均值
x_std.std() #用std()查看方差
scaler.fit_transform(data) #使用fit_transform(data)一步达成结果
scaler.inverse_transform(x_std) #使用inverse_transform逆转标准化

http://www.lryc.cn/news/589847.html

相关文章:

  • CG--资料分析1
  • 【后端】配置SqlSugar ORM框架并添加仓储
  • Three.js 实战:使用 PBR 贴图打造真实地面材质
  • 《Qt实战开发》:从计算器到音乐播放器的全栈实现指南
  • 从理论到实践:操作系统进程状态的核心逻辑与 Linux 实现
  • echarts 自定义图例,并且一个图列控制多个系列
  • 在 kubernetes 上安装 jenkins
  • argo-rollouts部署
  • 分块(chunked) vs 滑动窗口(windowed)
  • 开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析(二)
  • 产品更新丨谷云科技 iPaaS 集成平台 V7.6 版本发布
  • Grok 系列大模型:xAI 的智能宇宙探秘
  • 使用 CrewAI 进行股票分析:自动化投资决策的新途径
  • 压力测试Apache Bench(ab)
  • Anspire Open暑期上新季 - 第二弹Anspire Browser Agent,开启云端自动化新纪元
  • Go语言自学笔记(2.3-2.6)
  • iOS 性能监控工具全解析 选择合适的调试方案提升 App 性能
  • 【游戏引擎之路】登神长阶(十九):3D物理引擎——岁不寒,无以知松柏;事不难,无以知君子
  • DrissionPage:一款让网页自动化更简单的 Python 库
  • 【BUG】ValueError: Unable to find out axis 2.0 in start_ornt
  • 设计模式之【观察者模式】
  • 单片机(STM32-中断)
  • [2025CVPR-图像检索方向] COBRA:一种用于小样本自适应检索增强模型
  • 实训十一——网络通信原理
  • 震坤行获取商品SKU操作详解
  • LeetCode|Day15|125. 验证回文串|Python刷题笔记
  • C语言基础笔记——位操作
  • 虚幻引擎5 GAS开发俯视角RPG游戏 #06-7:无限游戏效果
  • 使用EF Core修改数据:Update方法与SaveChanges的深度解析
  • 前端性能追踪工具:用户体验的毫秒战争