当前位置: 首页 > news >正文

对数据进行标准化和归一化

数据的形式:保存在CSV中,第一列为姓名,第二列之后为特征。

 标准化

输入文件的路径,设置保存转化后的文件路径

import pandas as pd
from sklearn.preprocessing import StandardScaler# 读取CSV文件
data = pd.read_csv(r'C:\Users\Administrator\Desktop\Breast\benign.csv')# 提取特征列
features = data.drop('Name', axis=1)# 初始化标准化器
scaler = StandardScaler()# 对特征进行标准化
scaled_features = scaler.fit_transform(features)# 将标准化后的特征重新添加到原始DataFrame中
scaled_data = pd.DataFrame(scaled_features, columns=features.columns)
scaled_data.insert(0, 'Name', data['Name'])# 定义标准化后的文件路径
output_file = r'C:\Users\Administrator\Desktop\Breast\benign_standardized.csv'# 将标准化后的数据保存到CSV文件中
scaled_data.to_csv(output_file, index=False)# 打印成功信息
print("数据已经成功标准化并保存到文件:", output_file)

归一化

输入文件的路径,设置保存转化后的文件路径

import pandas as pd
from sklearn.preprocessing import MinMaxScaler# 读取CSV文件
data = pd.read_csv(r'C:\Users\Administrator\Desktop\Breast\benign.csv')# 提取特征列
features = data.drop('Name', axis=1)# 初始化归一化器
scaler = MinMaxScaler()# 对特征进行归一化
normalized_features = scaler.fit_transform(features)# 将归一化后的特征重新添加到原始DataFrame中
normalized_data = pd.DataFrame(normalized_features, columns=features.columns)
normalized_data.insert(0, 'Name', data['Name'])# 定义归一化后的文件路径
output_file = r'C:\Users\Administrator\Desktop\Breast\benign_normalized.csv'# 将归一化后的数据保存到CSV文件中
normalized_data.to_csv(output_file, index=False)# 打印成功信息
print("数据已经成功归一化并保存到文件:", output_file)

http://www.lryc.cn/news/347372.html

相关文章:

  • 【从零开始学架构 架构基础】二 架构设计的复杂度来源:高性能复杂度来源
  • OpenHarmony 实战开发——3.1 Release + Linux 原厂内核Launcher起不来问题分析报告
  • 小猫咪邮件在线发送系统源码,支持添加附件
  • Django REST framework(DRF)是什么?
  • 用hMailServer+roundcubemail+宝塔安装配置一个自己的邮箱服务
  • ctfshow 框架复现
  • 【Linux-IMX6ULL-DDR3简介测试-RGBLCD控制原理】
  • 贪心算法-----柠檬水找零
  • MySQL技能树学习
  • java 动态代理详解
  • Web路径专题
  • 解决vue3项目打包后部署后某些静态资源图片不加载问题
  • 传感网应用开发教程--AT指令访问新大陆云平台(ESP8266模块+物联网云+TCP)
  • 项目提交到空的git仓库流程
  • 【Python】在Windows Server上部署Flask后端服务器
  • 机器学习作业4——朴素贝叶斯分类器
  • BUU-[GXYCTF2019]Ping Ping Ping
  • 代码随想录Day 41|Leetcode|Python|198.打家劫舍 ● 213.打家劫舍II ● 337.打家劫舍III
  • 【吴恩达机器学习-week2】多个变量的特征缩放和学习率问题
  • C#字符串的拼接
  • 哈希表Hash table
  • jdk8新特性----Lambda表达式
  • 在STM32中用寄存器方式点亮流水灯
  • TCP(TCP客户端、服务器如何通信)
  • pdf 文件版面分析--PyMuPDF (python 文档解析提取)
  • sql update 多表关联 inner join
  • 【OceanBase诊断调优】—— 租户资源统计项及其查询方法
  • 【一键录音,轻松转换:用Python打造个性化音频记录工具】
  • Java类与对象(一)
  • python中的装饰器,例子说明