当前位置: 首页 > news >正文

Pandas 33个冷知识 0721

Pandas 33个冷知识

  1. 从Excel读取数据: 使用 pd.read_excel('file.xlsx') 来读取Excel文件。

  2. 写入Excel: 使用 df.to_excel('file.xlsx', index=False) 将DataFrame写入Excel文件。

  3. 创建日期索引: 使用 df.set_index(pd.to_datetime(df['date'])) 创建日期索引。

  4. 向后填充缺失值: 使用 df.fillna(method='bfill') 向后填充缺失值。

  5. 按索引选取多行: 使用 df.loc[[1, 2, 5]] 按索引选取多行。

  6. 按位置选取多行: 使用 df.iloc[[0, 2, 4]] 按位置选取多行。

  7. 创建空Series: 使用 pd.Series(dtype='float64') 创建一个空Series。

  8. 重置列顺序: 使用 df = df[['col2', 'col1']] 重新排列DataFrame的列顺序。

  9. 按多列排序: 使用 df.sort_values(by=['col1', 'col2'], ascending=[True, False]) 按多列排序。

  10. 按列查找最大值的行: 使用 df.loc[df['col'].idxmax()] 查找列中最大值所在的行。

  11. 按列查找最小值的行: 使用 df.loc[df['col'].idxmin()] 查找列中最小值所在的行。

  12. 按条件删除行: 使用 df.drop(df[df['col'] < 10].index) 按条件删除行。

  13. 按条件更新值: 使用 df.loc[df['col'] < 10, 'col'] = 10 按条件更新值。

  14. 按列计算累计最大值: 使用 df['cummax'] = df['col'].cummax() 计算列的累计最大值。

  15. 按列计算累计最小值: 使用 df['cummin'] = df['col'].cummin() 计算列的累计最小值。

  16. 按列计算累计乘积: 使用 df['cumprod'] = df['col'].cumprod() 计算列的累计乘积。

  17. 计算百分比变化: 使用 df['pct_change'] = df['col'].pct_change() 计算列的百分比变化。

  18. 滚动窗口最大值: 使用 df['rolling_max'] = df['col'].rolling(window=3).max() 计算滚动窗口最大值。

  19. 滚动窗口最小值: 使用 df['rolling_min'] = df['col'].rolling(window=3).min() 计算滚动窗口最小值。

  20. 检测重复值: 使用 df.duplicated() 检测重复值。

  21. 删除所有重复值: 使用 df.drop_duplicates() 删除所有重复值。

  22. 替换值中的空字符串: 使用 df.replace('', np.nan, inplace=True) 替换值中的空字符串。

  23. 数据透视表(多值): 使用 pd.pivot_table(df, values=['val1', 'val2'], index='col1', columns='col2') 创建数据透视表。

  24. 分组并计算自定义函数: 使用 df.groupby('col').apply(lambda x: x.max() - x.min()) 进行分组并计算自定义函数。

  25. 扩展列表到多行: 使用 df.explode('col') 将列表扩展到多行。

  26. 按列计算频率表: 使用 pd.crosstab(df['col1'], df['col2']) 计算频率表。

  27. 将列名改为小写: 使用 df.columns = df.columns.str.lower() 将所有列名改为小写。

  28. 将列名改为大写: 使用 df.columns = df.columns.str.upper() 将所有列名改为大写。

  29. 按列值绘制直方图: 使用 df['col'].hist() 绘制列值的直方图。

  30. 按列值绘制密度图: 使用 df['col'].plot(kind='kde') 绘制列值的密度图。

  31. 按列值绘制箱线图: 使用 df.boxplot(column='col') 绘制列值的箱线图。

  32. 按列值绘制散点图: 使用 df.plot.scatter(x='col1', y='col2') 绘制列值的散点图。

  33. 数据框列值字符串替换: 使用 df['col'].str.replace('old', 'new') 替换列中的字符串。

http://www.lryc.cn/news/403825.html

相关文章:

  • C++ map和set的使用
  • yarn的安装和配置以及更新总结,npm的对照使用差异
  • 【Git命令】git rebase之合并提交记录
  • 为什么品牌需要做 IP 形象?
  • Kubernetes 1.24 版弃用 Dockershim 后如何迁移到 containerd 和 CRI-O
  • 70. 爬楼梯【 力扣(LeetCode) 】
  • R语言优雅的把数据基线表(表一)导出到word
  • XMl基本操作
  • Linux——Shell脚本和Nginx反向代理服务器
  • pyspark使用 graphframes创建和查询图的方法
  • 【web】-flask-简单的计算题(不简单)
  • Apache Sqoop
  • 【Python】TensorFlow介绍与实战
  • 第100+16步 ChatGPT学习:R实现Xgboost分类
  • 【操作系统】定时器(Timer)的实现
  • 鸿蒙Navigation路由能力汇总
  • ​1:1公有云能力整体输出,腾讯云“七剑”下云端
  • 【iOS】APP仿写——网易云音乐
  • react 快速入门思维导图
  • 微软研究人员为电子表格应用开发了专用人工智能LLM
  • [算法题]两个链表的第一个公共结点
  • MySQL事务管理(上)
  • HTML2048小游戏
  • 为 android编译 luajit库、 交叉编译
  • 【音视频】音频重采样
  • 卷积神经网络学习问题总结
  • 嵌入式面试总结
  • 超简单安装指定版本的clickhouse
  • FlowUs横向对比几款笔记应用的优势所在
  • 收银系统源码-千呼新零售收银视频介绍