python DataFrame基础操作
以下是关于 Pandas DataFrame 的基础操作整理,涵盖创建、数据操作、查询和常用功能:
创建 DataFrame
从字典创建,键为列名,值为数据列表:
import pandas as pd
data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
df = pd.DataFrame(data)
从列表创建,需单独指定列名:
data = [['Alice', 25], ['Bob', 30]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
数据查看
查看前 5 行:
df.head()
查看统计摘要:
df.describe()
数据选择
选择单列:
df['Name']
选择多列:
df[['Name', 'Age']]
按行选择:
df.iloc[0] # 选择第一行
数据过滤
条件过滤:
df[df['Age'] > 25]
多条件过滤:
df[(df['Age'] > 20) & (df['Name'] == 'Alice')]
数据修改
添加新列:
df['Gender'] = ['F', 'M']
修改列值:
df.loc[df['Name'] == 'Alice', 'Age'] = 26
缺失值处理
检查缺失值:
df.isnull()
填充缺失值:
df.fillna(0)
排序
按列排序:
df.sort_values('Age', ascending=False)
分组统计
分组计算:
df.groupby('Gender')['Age'].mean()
数据输入输出
读取 CSV:
df = pd.read_csv('data.csv')
保存到 CSV:
df.to_csv('output.csv', index=False)
合并数据
横向合并:
pd.concat([df1, df2], axis=1)
纵向合并:
pd.concat([df1, df2], axis=0)
这些操作涵盖了 Pandas DataFrame 的大部分基础功能,适合日常数据处理需求。