当前位置: 首页 > news >正文

pandas表格并表(累加合并)

今天需求是用pandas的两张表格合并起来,其中重复的部分将数据进行相加。
用到的是combine()这个函数。

函数详细的使用可以看这个大佬的文章:
https://www.cnblogs.com/traditional/p/12727997.html
(这个文章使用的测试数据有个陷阱,后面会说。)

我想说的一个场景是这样的:
表一:
在这里插入图片描述
表二:
在这里插入图片描述
可以看到两个测试表的区别在于D列,表一的D列是没有数据的,而表二的有。

一开始直接使用这个语句进行合并:

def sum(a, b):return a + b
final_df = df_one.combine(df_two, sum)

在这里插入图片描述
得到的结果是这样的,明明表二的D列有数据,但是没有合并。

跟了下代码,这里的a + b是实际上将两个Series进行加操作,应该是nan加上一个数字的时候会报错,但是pandas的处理将出现错误的格子的错误信息忽视掉了,所以导致没有合并。
series.py文件
这里就要提到上面那个文章里面的陷阱,测试数据都是使用单行Series进行合并,所以combine后面的func实际上是对单个数值变量进行操作。
而如果你和我一样是用一个二维的dataframe表进行combine,他其实是对每个Series进行操作,所以简单的用+进行合并操作是会有问题的。这一点尤其是在使用lambda表达式这种匿名函数时更容易被忽视的。
那对于二维的Dataframe表格我提出的解决办法是:

def sum(a, b):if pd.isna(a):return belif pd.isna(b):return aelse:return a + bdef sum_s(a, b):return a.combine(b, sum)final_df = df_one.combine(df_two, sum_s)

对combine操作进行嵌套,我明白我这个代码非常丑,但是他能用。
如果你能把这个代码写的更漂亮,欢迎你在评论区指出,如果看到我会及时修改。

碎碎念:
可能比较少人直接用pandas做excel处理的库?我用的搜索引擎没有找到对pandas进行并表的操作。
挺奇怪的,我觉得pandas明明非常好用,对格式兼容很好。Dataframe的使用也非常舒服。

http://www.lryc.cn/news/7521.html

相关文章:

  • 汽车直营模式下OTD全流程
  • 如何在 Canvas 上实现图形拾取?
  • 适用于媒体行业的管理数据解决方案—— StorageGRID Webscale
  • Springboot+ElasticSearch构建博客检索系统-学习笔记01
  • vue3+element-plus el-descriptions 详情组件二次封装(vue3项目)
  • No.14新一代信息技术
  • 微信小程序开发(五)小程序代码组成2
  • 关于tensorboard --logdir=logs的报错解决办法记录
  • em,rem,px,rpx,vw,vh的区别与使用
  • Vue+node.js医院预约挂号信息管理系统vscode
  • Java真的不难(五十四)RabbitMQ的入门及使用
  • Unity | Script Hot Reload
  • 3|射频识别技术|第五讲:数据通信和编码技术|第九章:编码与调制|重点理解掌握传输介质中的有线传输介质
  • 【遇见青山】基于Redis的Feed流实现案例
  • 【芯片前端】一文搞定|寄存器组织生成与uvm ral_model环境全流程
  • Leetcode力扣秋招刷题路-0061
  • xilinx srio ip学习笔记之axistream接口
  • 轨迹误差评估指标[APE/RPE]和EVO
  • uni-app 消息推送功能UniPush
  • 面试题(二十六)场景应用
  • 密码技术在车联网安全中的应用与挑战
  • 富媒体数据管理解决方案:简化、优化、自动化
  • QT入门Input Widgets之QFontComboBox、QTextEdit、QPlainTextEdit、QDial、QKeySequenceEdit
  • Java企业级开发学习笔记
  • 【算法基础】(一)基础算法 ---高精度
  • 电源口防雷器电路设计方案
  • 【零基础入门前端系列】—表单(七)
  • Linux安装python3
  • 怎么通过中级职称有窍门吗?
  • SAP ABAP根据事务码查找增强最直接的方法