当前位置: 首页 > news >正文

pandas基本操作

  1. df.head()/tail() 查看头/尾5条数据;
  2. df.info 查看表格简明概要;
  3. df.dtypes 查看字段数据类型;
  4. df.index 查看表格索引;
  5. df.columns 查看表格列名;
  6. df.values 以array形式返回指定数据的取值;
  7. list(dt.groupby("字段A")) groupby会把数据框按指定的字段分成几个小块,转化成列表,即可输出各部分的模块展示;
  8. groupby的聚合函数:
    函数名说明
    count分组中非NA值的数量
    sum非NA值的和
    mean非NA值的平均值
    median非NA值的算术中位数
    std、var无偏(分母为n-1)标准差和方差
    min、max非NA值的最小值和最大值
    prod非NA值的积
    first、last第一个或最后一个非NA值
  9. groupby的参数:
    
    by:mapping, function, str, or iterable。用于确定groupby的组。如果by是一个函数,那么会调用对象索引的每个值。如果传递了一个dict或Series,则将使用Series或dict的值来确定组。一个str或者一个strs列表可以通过自己的列传递给group。axis:轴,int值,默认为0level:如果axis是一个MultiIndex(分层),则按特定的级别分组。int值,默认为Noneas_index:对于聚合输出,返回带有组标签的对象作为索引。as_index=False实际上是“SQL风格”分组输出,boolean值,默认为True。sort:排序。关闭此功能以获得更好的性能。boolean值,默认True。group_keys:当调用apply时,添加group key来索引来识别片断。boolean值,默认True。squeeze:尽可能减少返回类型的维度,否则返回一致的类型。boolean值,默认False。
  10. dt.groupby(['版本','级别level','星期','时段'],as_index=False)['供应量'].count(),则可以显示excel数据透视表的功效
  11. dt.columns=['','','']统一赋值重命名,或者使用rename对指定列进行修改
    dt.rename(columns={'供需指数':'SDI均值'},inplace=True)
  12. 删除满足条件的行:drop删除一行的时候比较方便
    fx1.drop(fx1[fx1['版本']=='进阶版LTO试听课'].index,inplace=True)
    fx1=fx1.loc[(fx1['版本']!='进阶版LTO试听课'),:]
    &表示并集,|表示或集,~表示与列出的条件相反,:表示希望保留所有列
  13. 删除满足条件的行后,重置索引:drop删除原索引,inplace替换原文件
    fx1.reset_index(drop=True,inplace=True)
  14. 色阶配置:
    import seaborn as sns
    # cmp=sns.light_palette('pink',as_cmap=True)
    # cmp=sns.color_palette('Pastel1_r',as_cmap=True)
    # cmp=sns.color_palette('Pastel2',as_cmap=True)
    cmp=sns.color_palette('Spectral',as_cmap=True)
    therm=df.iloc[:,:].style.background_gradient(cmap=cmp)

    为excel表格配置色阶,可以用iloc选择对哪些区域生效,用pd.ExcelWriter进行保存即可

  15. 条件格式常用:

http://www.lryc.cn/news/9055.html

相关文章:

  • 论文笔记NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
  • 花3个月面过京东测开岗,拿个20K不过分吧?
  • Leetcode DAY 35:柠檬水找零and根据身高重建队列 and用最少数量的箭引爆气球
  • java-spring_bean实例化
  • 微信中如何接入机器人才比较安全(不会收到警告或者f号)之第三步正式接入
  • 高通平台开发系列讲解(Sensor篇)IAM20680驱动程序的使用
  • 【VictoriaMetrics】VictoriaMetrics集群伪分布式部署(二进制版)
  • 华为手表开发:WATCH 3 Pro(7)获取电量信息
  • 【数据结构】动态顺序表的接口实现(附图解和源码)
  • L2-003 月饼
  • volatile不等于原子操作
  • 每天10个前端小知识 【Day 15】
  • 异构数据库同步方案
  • MySQL-系统信息函数
  • Windows环境下使用Pycharm运行sh文件
  • Flutter启动流程浅析
  • 004:NumPy的应⽤-2
  • 一文了解JAVA中同步、异步、阻塞和非阻塞
  • 查询股票交易日接口可以用C++实现查询当日成交吗?
  • java中常见的json库以及对应的用法
  • 德赛西威NAV75*-SV731*导航升级(凯立德J30)实战
  • [USACO2023-JAN-Bronze] T1 LEADERS 题解
  • 第二章:unity性能优化之drawcall优化-1
  • 【2341. 数组能形成多少数对】
  • [TPAMI‘21] Heatmap Regression via Randomized Rounding
  • pytorch下tensorboard使用[远程服务器]
  • CentOS下安装Nginx的详细步骤
  • CSS编码规范
  • Linux下makefile 编译项目
  • Linux磁盘查看,使用(分区、格式化、挂载)