当前位置: 首页 > news >正文

Sklearn 机器学习 数值标准化

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习:数值标准化实战指南(含 CSV 读取与训练测试处理)

在机器学习中,特征的数值标准化(Normalization/Standardization) 是模型训练前非常重要的预处理步骤,尤其在使用如 SVM、KNN、逻辑回归等对特征尺度敏感的算法时更是关键。

💡 术语说明:在实际使用中,NormalizationStandardization 虽常被混用,但两者含义略有不同:

  • Standardization 指将数据转换为标准正态分布(均值为0,标准差为1);
  • Normalization 通常指将数据缩放到特定区间(如 [0,1]);

本文统一使用“数值标准化”泛指特征尺度调整的所有方法,具体方法将在文中分别说明。


📌 一、什么是数值标准化?

数值标准化是将特征数据缩放到统一的尺度上,常见方法包括:

  • Z-score 标准化(StandardScaler)
    将每一维特征转换为均值为 0,标准差为 1 的分布:

    z = x − μ σ z = \frac{x - \mu}{\sigma} z=σxμ

    其中 $\mu$ 为特征均值,$\sigma$ 为标准差。

  • 最小-最大缩放(MinMaxScaler)
    将特征压缩到指定区间(如 [0, 1]):

    x ′ = x − x min ⁡ x max ⁡ − x min ⁡ x' = \frac{x - x_{\min}}{x_{\max} - x_{\min}} x

http://www.lryc.cn/news/598853.html

相关文章:

  • C++高效实现轨迹规划、自动泊车、RTS游戏、战术迂回包抄、空中轨迹、手术机器人、KD树
  • JSONObject相关知识点
  • 【MediaTek】AN7563编译出现npu/en7563/host/Makefile: No such file or directory
  • Silly Tavern 教程②:首次启动与基础设置
  • Windows 如何更改 ModelScope 的模型下载缓存位置?
  • 循环神经网络--LSTM模型
  • 跨境支付入门~国际支付结算(区块链篇)
  • 推荐系统如何开发
  • AI大模型资源
  • Spring Boot 遇上 MyBatis-Plus:高效开发的奇妙之旅
  • 10_Spring Boot 中的 @Scheduled 注解是单线程还是多线程?同步还是异步?
  • Percona pt-archiver 出现长事务
  • IntelliJ IDEA
  • 单片机的第一个程序—LED灯的控制
  • HBase + PostgreSQL + ElasticSearch 联合查询方案
  • 斐波那契数列策略
  • 新能源电池厂自动化应用:Modbus TCP转DeviceNet实践
  • Opencv C# 重叠 粘连 Overlap 轮廓分割 (不知道不知道)
  • C语言(长期更新)第5讲:数组练习(三)
  • windows11通过wsl安装Ubuntu到D盘,安装docker及宝塔面板
  • 【物联网】基于树莓派的物联网开发【16】——树莓派GPIO控制LED灯实验
  • 卫星物联网:使用兼容 Arduino 的全新 Iridium Certus 9704 开发套件深入探索
  • MSOP/DIFOP端口 vs. IP地址的关系以及每个IP下面有什么自己的东西
  • JavaSE:对一门面向对象语言有一个初步认识
  • pytest官方Tutorial所有示例详解(二)
  • 这几天都是发癫写的
  • 计算机视觉技术剖析:轮廓检测、模板匹配及特征点匹配
  • 背包DP之分组背包
  • 读书笔记(王阳明心学)
  • 高可用架构模式——异地多活设计步骤