当前位置: 首页 > news >正文

python sklearn机械学习-数据预处理

  • 🌈所属专栏:【机械学习】
  • 作者主页:  Mr.Zwq
  • ✔️个人简介:一个正在努力学技术的Python领域创作者,擅长爬虫,逆向,全栈方向,专注基础和实战分享,欢迎咨询!

您的点赞、关注、收藏、评论,是对我最大的激励和支持!!!🤩🥰😍

目录

安装

数据

缺失值处理

数据标准化

对文本数据进行数字编码

总结


安装

pip install scikit-learn

数据

X,y即为所需要进行回归处理的数据。

操作:拆分为训练集和测试集

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3, random_state=12)

缺失值处理

# 缺失值处理
from sklearn.impute import SimpleImputer# 创建SimpleImputer对象,使用均值填充缺失值
imputer = SimpleImputer(strategy='mean')# 对数据集进行拟合和转换
X_train = imputer.fit_transform(X_train)
X_test = imputer.transform(X_test)

数据标准化

# 数据标准化
#fit(), 用来求得训练集X的均值,方差,最大值,最小值,这些训练集x固有的属性。
#transform(),在fit的基础上,进行标准化,降维,归一化等操作。
#fit_transform(),包含上述两个功能。from sklearn.preprocessing import StandardScalerscaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

对文本数据进行数字编码

# 对某列进行编码
from sklearn.preprocessing import LabelEncoder# 创建LabelEncoder对象
encoder = LabelEncoder()# data数据自行提供
data['朝向编码'] = encoder.fit_transform(data['朝向'])

处理后效果如下:


总结

感谢观看,原创不易,如果觉得有帮助,请给文章点个赞吧,让更多的人看到。🌹🌹🌹

👍🏻也欢迎你,关注我。👍🏻

如有疑问,可在评论区留言哦~

http://www.lryc.cn/news/390731.html

相关文章:

  • 搜索引擎常用语法
  • 华为智能驾驶方案剖析
  • DDR3(一)
  • Eureka与Spring Cloud Bus的协同:打造智能服务发现新篇章
  • Kafka入门到精通(三)-Kafka
  • 高校教师教学质量评估系统-计算机毕业设计源码03344
  • 币界网讯,预计以太坊现货 ETF 将于 7 月中旬推出
  • 【FFmpeg】avio_open2函数
  • 技术成神之路:设计模式(二)建造者模式
  • 基于Springboot+Vue+mysql仓库管理系统仓库进销存管理系统
  • 爬虫scrapy库精简使用大全
  • Qt - 如何在新线程 (QThread)中使用一个进程 (QProcess)?
  • Qt绘制多线段
  • 去中心化革命:探索区块链技术的前沿
  • 2024年湖南省各市科小申报时间(科技型中小企业申报流程、条件、好处)新政
  • 【JD-GUI】MacOS 中使用Java反编译工具JD-GUI
  • C++:求梯形面积
  • 学会python——在excel中写入数据(python实例十三)
  • Stable Diffusion【基础篇】:降噪强度(denoising strength)
  • 【Python】语法入门
  • 匠心独运:红酒与手工艺的很好结合
  • 第20章 Mac+VSCode配置C++环境
  • FactoryBean 原理简介
  • Redis中hash类型的操作命令(命令的语法、返回值、时间复杂度、注意事项、操作演示)
  • UE5基本操作(二)
  • React Navigation 和 Expo Router
  • 如何使用python网络爬虫批量获取公共资源数据教程?
  • 常见位运算总结
  • 自动化任务工具 -- zTasker v1.94 绿色版
  • mybatis mapper.xml 比较运算符(大于|小于|等于)的写法: 转义和<![CDATA[]]>