5.利用Pandas以及Numpy进行数据清洗
1、缺失值处理
import pandas as pd
import numpy as np#创建一张7行5列带有缺失值的表,表中的数据0-100随机生成,索引是python1.
df = pd.DataFrame(data=np.random.randint(0,100,size=(7,5)), index =[i for i in 'pythonl'])df.iloc[2,3] = Nonedf.iloc[4,2] = np.nandf.iloc[1,4] = None
2.查看缺失值
3.删除缺失值
4.填充缺失值
5.插值填充(interpolate)
6.缺失值计算
7.替换值(replace)
8.重复值
9.排序数据Sort_values()
10.数据类型的转换
11.文本值处理