当前位置: 首页 > news >正文

机器学习笔记(持续更新)

使用matplotlib绘图:

import matplotlib.pyplot as plt
fig, ax=plt.subplots()  #创建一个图形窗口
plt.show()   #不绘制任何内容,直接显示空图

重复值处理:

重复值处理代码:

import pandas as pd
data = pd.DataFrame({'学号': [1, 2, 3, 4, 5, 6, 7, 7, 8],'身高': [172,162,175,170,168,160,164,164,160],'体重': [70,62,75,68,67,58,64,64,53]
})
data.drop_duplicates(['学号'], keep = 'last', inplace=True)
print(data)# drop_duplicates方法的正确语法是drop_duplicates(subset=None, keep='first', inplace=False),
# 其中keep参数只能是
# 'first'(保留第一次出现的重复行)、
# 'last'(保留最后一次出现的重复行)
#  False(删除所有重复行)

缺损值删除:

缺损值删除代码:

import pandas as pd
import numpy as np
data = pd.DataFrame({'学号': [1, 2, 3, 4, 5, 6, 7, 7, 8],'身高': [172,162,175,170,np.nan,160,164,164,160],'体重': [70,62,75,68,67,58,64,64,53]
})
data=data.dropna()  #只要有空值就删除
data=data.dropna(how='all')  #只有当一行中所有值都是缺失值才删除改行,如果至少有一个非缺失值,则改行不会被删除
print(data)

缺损值填充:

缺损值填充代码:

import pandas as pd
import numpy as np
data = pd.DataFrame({'学号': [1, 2, 3, 4, 5, 6, 7, 7, 8],'身高': [172,162,175,170,np.nan,160,164,164,160],'体重': [70,62,75,68,67,58,64,64,53]
})
# data=data.fillna(199)  #用199数值填充缺损的数据
# data=data.fillna(method='ffill')  #使用缺损值前一行填充缺损值
# data=data.fillna(method='bfill')  #使用缺损值后一行填充缺损值
data['身高'].fillna(data['身高'].mean(),inplace=True)  #使用身高的均值来填充缺损值
print(data)

异常值填充:

异常值填充代码:

import pandas as pd
data = pd.DataFrame({'学号': [1, 2, 3, 4, 5, 6, 7, 7, 8],'身高': [172,162,175,170,1700,160,164,164,160],'体重': [70,62,75,68,67,58,64,64,53]
})
print("是否存在超出正常身高范围的值:",any(data['身高']>240))  #检查是否存在异常值
renew_value=data['身高'][data['身高']<200].max()
data.loc[data['身高']>200,'身高']=renew_value    #用身高最高值填充异常值
print(data)
http://www.lryc.cn/news/457823.html

相关文章:

  • Nginx 配置之server块
  • 魅族Lucky 08惊艳亮相:极窄四等边设计引领美学新风尚
  • 自动化的抖音
  • 无人机之巡航控制篇
  • 面试必问的7大测试分类!一文说清楚!
  • 深信服上网行为管理AC无法注销在线用户
  • 使用GitLab CI构建持续集成案例
  • WSL2环境下Ubuntu的Docker安装与配置
  • 使用vscode调试wails项目(golang桌面GUI)
  • Java中注解与反射的详细介绍
  • Redis 过期时间删除策略详解
  • C语言_内存函数
  • 基于s32ds平台指定变量储存位置
  • 什么是快充协议、支持多协议的USB Type-C受电端取电芯片
  • 在Vue CLI项目中使用ECharts:详细指南
  • 第二阶段:mysql(学完就隐藏版)
  • Spring Cloud微服务
  • 后端复习资料
  • C++和OpenGL实现3D游戏编程【连载14】——VBO、VAO和EBO应用
  • AI + 智能互助平台(一点杂想)
  • 其他浏览器可以联网,但edge不能联网
  • Redis 缓存淘汰策略:LRU 和 LFU 的缺点及解决方案详解
  • 软件工程pipeline梳理
  • npm运行时出现npm ERR! builtins is not a function报错!
  • 2024年软件设计师中级(软考中级)详细笔记【5】软件工程基础知识上(分值10+)
  • C++:vector(题目篇)
  • JS 怎么监听复制事件 并获取复制内容 并修改复制文本内容
  • 安卓使用.9图实现阴影效果box-shadow: 0 2px 6px 1px rgba(0,0,0,0.08);
  • CSS3-Day1
  • 网站集群批量管理-Ansible(ad-hoc)