pandas series常用函数
常用 pandas Series 函数
创建与初始化
通过列表或字典创建 Series:
import pandas as pd
s1 = pd.Series([1, 2, 3]) # 从列表创建
s2 = pd.Series({'a': 1, 'b': 2}) # 从字典创建
指定索引和名称:
s = pd.Series(data=[10, 20, 30], index=['x', 'y', 'z'], name='example')
数据访问
通过索引或位置访问元素:
s['a'] # 标签索引
s[0] # 位置索引
s.loc['a'] # 显式标签索引
s.iloc[0] # 显式位置索引
切片操作:
s[1:3] # 位置切片
s['a':'c'] # 标签切片(包含结束点)
数据操作
数学运算:
s + 10 # 标量运算
s * 2
s1 + s2 # Series 间运算(按索引对齐)
统计函数:
s.sum() # 求和
s.mean() # 平均值
s.std() # 标准差
s.min() # 最小值
s.max() # 最大值
s.quantile(0.25) # 分位数
数据处理
缺失值处理:
s.isna() # 检测缺失值
s.fillna(0) # 填充缺失值
s.dropna() # 删除缺失值
类型转换:
s.astype(float) # 类型转换
排序与去重
排序操作:
s.sort_values() # 按值升序
s.sort_values(ascending=False) # 降序
s.sort_index() # 按索引排序
去重操作:
s.unique() # 返回唯一值数组
s.nunique() # 唯一值数量
s.drop_duplicates() # 删除重复值
布尔索引
条件筛选:
s[s > 2] # 值大于2的元素
s[(s > 1) & (s < 4)] # 多条件筛选
字符串处理(需为字符串类型)
字符串方法:
s.str.upper() # 转为大写
s.str.contains('a') # 包含检测
s.str.split('_') # 字符串分割
时间序列处理(需为时间类型)
时间相关操作:
s.dt.year # 提取年份
s.dt.month # 提取月份
s.dt.day # 提取日
其他实用函数
重置索引:
s.reset_index(drop=True) # 丢弃旧索引
值计数:
s.value_counts() # 各值出现次数
应用函数:
s.apply(lambda x: x**2) # 应用自定义函数
复制 Series:
s_copy = s.copy() # 深拷贝