当前位置: 首页 > news >正文

27 pandas 数据透视

文章目录

  • pivot_table 函数
    • 1、index需要聚合的列名,默认情况下聚合所有数据值的列
    • 2、values在结果透视的行上进行分组的列名或其它分组键【就是透视表里显示的列】
    • 3、columns在结果透视表的列上进行分组的列名或其它分组键
    • 4、Aggfunc聚合函数或函数列表(默认情况下是mean)可以是groupby里面的任意有效函数
    • 5、fill_value 在结果表中替换缺失值
    • 6、dropna 如果为True,将不含所有条目均为Na的列(默认为False)
    • 7、margins 添加行/列小计和总计 (默认为False)
  • 交叉表 crosstab

pivot_table 函数

在这里插入图片描述

1、index需要聚合的列名,默认情况下聚合所有数据值的列

import pandas as pd
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'])
print(data2)

在这里插入图片描述

2、values在结果透视的行上进行分组的列名或其它分组键【就是透视表里显示的列】

import pandas as pd
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'],values=['数量','金额'])
print(data2)

在这里插入图片描述

3、columns在结果透视表的列上进行分组的列名或其它分组键

import pandas as pd
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'],values=['数量','金额'],columns='所属区域')
print(data2)

在这里插入图片描述

4、Aggfunc聚合函数或函数列表(默认情况下是mean)可以是groupby里面的任意有效函数

import pandas as pd
import numpy as np
path='C:/Users/Admin/Desktop/pandas/透视.xlsx'
data = pd.read_excel(path)
print(data)
print("***********************")
data2=pd.pivot_table(data,index=['部门','销售人员'],values=['数量','金额'],columns='所属区域',aggfunc=[sum,np.mean])
print(data2)

在这里插入图片描述

5、fill_value 在结果表中替换缺失值

在这里插入图片描述

6、dropna 如果为True,将不含所有条目均为Na的列(默认为False)

在这里插入图片描述

7、margins 添加行/列小计和总计 (默认为False)

在这里插入图片描述

交叉表 crosstab

在这里插入图片描述

在这里插入图片描述

http://www.lryc.cn/news/14518.html

相关文章:

  • 1.2 学习环境准备
  • Http1.0协议常识
  • “终于懂了” 系列:组件化框架 ARouter 完全解析(三)AGP/Transform/ASM—动态代码注入
  • 传闻腾讯引进Quest 2?我觉得可行性很低
  • 【数据集】CMIP6气候模式数据下载
  • 华为OD机试 - 最长的元音字符串 | 机试题算法思路 【2023】
  • 浅谈c++引用
  • 2023什么是分销商城?怎么搭建分销商城
  • 408数据结构考点总结
  • 虹科分享 | 网络流量监控 | 你的数据能告诉你什么:解读网络可见性的4种数据类型
  • SpringBoot日志框架使用详解
  • 剑指offer-消失的数字、数组中出现的次数
  • axios请求配置baseURL选项
  • 风储VSG-基于虚拟同步发电机的风储并网系统MATLAB仿真
  • vim常用命令
  • 华为OD机试 - 最差产品奖 | 机试题算法思路 【2023】
  • HR:你会Python数据分析吗?
  • 算法18:LeetCode_链表相关算法题
  • SpringBoot集成Tomcat服务
  • 【机器学习】决策树-C4.5算法
  • actipro-winforms-controls-23.1.0 Crack
  • 适合打游戏用的蓝牙耳机有哪些?吃鸡无延迟的蓝牙耳机推荐
  • 1000:入门测试题目[不一样的题解][85种写法]【A+B问题】
  • FastReport .NET 2023.1.13 Crack
  • unzip: cannot find zipfile directory in one of
  • RFC4543: Galois Message Authentication Code (GMAC);CONFIG_CRYPTO_GCM
  • 【YOLOv5】 02-标注图片,训练并使用自己的模型
  • 2023.2.15日学习内容(用户的增删改查)
  • 车载以太网 - 测试用例设计 - 时间参数 - 11
  • 【C#个人错题笔记】