当前位置: 首页 > news >正文

数据预处理(无量纲化、缺失值、分类特征、连续特征)

文章目录

      • 1. 无量纲化
        • 1.1 sklearn.preprocessing.MinMaxScaler
        • 1.2 sklearn.preprocessing.StandardScaler
      • 2. 缺失值
      • 3. 分类型特征
      • 4. 连续型特征

数据挖掘的五大流程包括:

  • 获取数据
  • 数据预处理
  • 特征工程
  • 建模
  • 上线

在这里插入图片描述

其中,数据预处理中常用的方法包括数据标准化和归一化。sklearn中包含众多的数据预处理模块,

在这里插入图片描述

  • 模块preprocessing:几乎包含数据预处理的所有内容
  • 模块Impute:填补缺失值专用
  • 模块feature_selection:包含特征选择的各种方法的实践
  • 模块decomposition:包含降维算法

1. 无量纲化

1.1 sklearn.preprocessing.MinMaxScaler

sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True)

1.2 sklearn.preprocessing.StandardScaler

sklearn.preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True)

2. 缺失值

3. 分类型特征

4. 连续型特征

【参考博客】:

  • 03、sklearn中的数据预处理和特征工程
  • 03.(2)数据预处理
http://www.lryc.cn/news/8751.html

相关文章:

  • 【C#基础】C# 运算符总结
  • 存储性能软件加速库(SPDK)
  • 微服务(五)—— 服务注册中心Consul
  • 冷冻电镜 - ChimeraX Density Map 密度图 操作
  • Matlab 点云旋转之轴角式
  • 2023美赛数学建模资料思路模型
  • Nginx配置HTTP强制跳转到HTTPS
  • 从实现到原理,聊聊Java中的SPI动态扩展
  • 3、MySQL字符集
  • 大漠插件最新中文易语言模块7.2302
  • 极客大挑战 2021
  • C#开发的OpenRA加载文件的管理
  • SSM实现文件上传
  • OPENCV计算机视觉开发实践-图像的基本概念
  • Android 9.0 ResolverActivity.java多个app选择界面去掉始终保留仅有一次
  • 【算法 | 例题简答】相关例题讲解
  • 浅谈AQS
  • 关于服务连接器(Servlet)你了解多少?
  • 面对学员的投诉,中创教育是如何处理的?
  • 算法问题——排序算法问题
  • ArcGIS网络分析之构建网络分析数据集(一)
  • 微电影的行业痛点有哪些?
  • spark3.0源码分析-driver-executor心跳机制
  • 数据分析就要选择这款免费报表工具
  • node学习-3:服务器渲染和客户端渲染
  • LeetCode刷题笔记和周赛题解总目录
  • 用类比方式学习编程中函数递归(个人理解仅供参考)(内含汉诺塔问题的求解)
  • 【云原生之Docker实战】使用Docker部署Taskover开源个人任务管理工具
  • 5、SQL编程开发与注意事项
  • Allegro如何通过视图显示区分动态和静态铜皮操作指导