当前位置: 首页 > news >正文

pandas 将多条记录整合成一条记录,每条记录的year和month字段组成新的字段名

你可以使用 Pandas 的 pivot_table()groupby() 方法,将多条记录整合成一条,并通过 yearmonth 这两个字段生成新的字段名。具体的实现方法是通过 pivot_table()yearmonth 作为列标签,将其他列中的数据进行整合。

假设你的数据框 df 的结构如下:

import pandas as pddata = {'id': [1, 1, 1, 2, 2],'year': [2023, 2023, 2024, 2023, 2024],'month': [1, 2, 1, 1, 1],'value': [10, 20, 30, 40, 50]
}df = pd.DataFrame(data)
print(df)

输出的原始数据:

   id  year  month  value
0   1  2023      1     10
1   1  2023      2     20
2   1  2024      1     30
3   2  2023      1     40
4   2  2024      1     50

目标:

yearmonth 组成新的字段名,并将 value 的值填入这些新列。

实现:

  1. 创建 year_month 字段:将 yearmonth 组合成一个新的列名。
  2. 使用 pivot_table 将数据透视:将 id 作为索引,将 year_month 作为列,value 作为要填充的数据。
# 1. 创建新的列名 'year_month'
df['year_month'] = df['year'].astype(str) + '_' + df['month'].astype(str)# 2. 使用 pivot_table 将数据透视
df_pivot = df.pivot_table(index='id', columns='year_month', values='value', aggfunc='first').reset_index()# 3. 填充数据,避免空值
df_pivot.fillna(0, inplace=True)# 查看结果
print(df_pivot)

输出结果:

year_month  id  2023_1  2023_2  2024_1
0            1     10.0     20.0     30.0
1            2     40.0      0.0     50.0

解释:

  1. 创建 year_month:将 yearmonth 列的值拼接成一个新的列(如 2023_1, 2023_2)。
  2. 数据透视:使用 pivot_table()id 作为索引,并将 year_month 作为新的列名,value 作为列值。
  3. 空值处理:透视后的表格中可能会有空值(例如某些 id 下没有某个 year_month),使用 fillna(0) 将其填充为 0。

这样你就能将原本多条记录整合成一条,并将 yearmonth 字段组成新的字段名。

http://www.lryc.cn/news/438256.html

相关文章:

  • C# 中的多线程同步:原子变量、原子操作、内存顺序和可见性
  • 视图(mysql)
  • elementui组件el-upload实现批量文件上传
  • 【JAVA入门】Day45 - 压缩流 / 解压缩流
  • Qt_自定义信号
  • 【运维方案】某系统运维需求方案参考(doc全原件2024)
  • Linux环境使用Git同步教程
  • c++临时对象导致的生命周期问题
  • CSP-J 算法基础 深度优先搜索
  • LeetCode题练习与总结:基本计算器 Ⅱ--227
  • Elasticsearch基础(七):Logstash如何开启死信队列
  • c语言--力扣简单题目(链表的中间节点)讲解
  • 【STM32 Blue Pill编程】-定时器计数模式
  • 【例题】lanqiao1331 二进制中 1 的个数
  • 【论文解读】图像序列识别:CRNN技术在场景文本识别中的应用与突破(附论文地址)
  • Vue3+CesiumJS相机定位camera
  • turbo译码算法MAX, MAX_SCALE and MAX_STAR的比较
  • 关于HarmonyOS的学习
  • 【雅特力AT32】搭建模板工程及GPIO点灯操作
  • 实战千问2大模型第三天——Qwen2-VL-7B(多模态)视频检测和批处理代码测试
  • 数据库索引底层数据结构之B+树MySQL中的页索引分类【纯理论干货,面试必备】
  • 编译QT源码时的configure参数须知
  • 如何利用人工智能大模型来进行数字化营销?
  • 【MRI基础】回波序列长度-echo train length ETL概念
  • (179)时序收敛--->(29)时序收敛二九
  • [Visual Stuidio 2022使用技巧]2.配置及常用快捷键
  • 每日奇难怪题(持续更新)
  • 江协科技STM32学习- P13 TIM定时器中断
  • git github仓库管理
  • 【JavaEE】线程安全性问题,线程不安全是怎么产生的,该如何应对