当前位置: 首页 > news >正文

Pandas Dataframe合并连接Join和merge 参数讲解

文章目录

  • 函数与参数分析
    • other
    • on
    • how
    • lsuffix, rsuffix, suffixes
    • left_index, right_index

函数与参数分析

在pandas中主要有两个函数可以完成table之间的join

Join的函数如下:
DataFrame.join(other, on=None, how=‘left’, lsuffix=‘’, rsuffix=‘’, sort=False, validate=None)

merge的函数如下:
DataFrame.merge(right, how=‘inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(‘_x’, ‘_y’), copy=None, indicator=False, validate=None)

下面会对于参数进行分别的解释。而通过可以调试的参数和

other

other是另外一个DataFrame或者Series,说明了join的两个表为DataFrame和other

on

on表示根据什么键进行连接,这个键可以是一个或者多个。如果这个连接的键在两个表中都存在就直接写就好,如果是一个就写一个String,多个就用list。

其中merge是需要给键值的。join默认的是使用索引的值。

如果不存在的话,那么则可以规定left_on和right_on。但是这个时候只能用merge, join是不支持这一点的。(merge的代码如下)

result = df1.merge(df2, left_on='key1', right_on='key2')

但是如果是连接多个键的名字都不同的时候,(比如df1.key1 == df2.key2 , df1.key3 == df2.key4) 那么则最好先通过rename的函数对Dataframe进行改名,之后再merge。

how

how表示的是连接的方式,一般包含下面的参数,默认是左连接
join:
how{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, default ‘left’
merge:
how{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, default ‘inner’
这里可以看见两者默认的连接方式是不同的

不同的连接方式如下:
在这里插入图片描述
当使用cross的时候不需要指定on啥,因为会把左右连接的所有的可能都返回,并不在乎谁和谁相等。

lsuffix, rsuffix, suffixes

如果有非连接key出现同名的情况,可以用此参数来规定区别两个列分别来自于哪个表。

left_index, right_index

这个是merge中的参数,当设置为True的时候,意思是使用索引进行连接。

http://www.lryc.cn/news/331399.html

相关文章:

  • ABC318 F - Octopus
  • Docker实战教程 第3章 Dockerfile
  • JSON在量化交易系统中的应用
  • x-cmd-pkg | broot 是基于 Rust 开发的一个终端文件管理器
  • 设置asp.net core WebApi函数请求参数可空的两种方式
  • Vue.js组件精讲 开篇:Vue.js的精髓——组件
  • R语言中的常用数据结构
  • 基于Python的微博旅游情感分析、微博舆论可视化系统
  • 机器学习的模型校准
  • 0.17元的4位数码管驱动芯片AiP650,支持键盘,还是无锡国家集成电路设计中心某公司的
  • 【C++】编程规范之内存规则
  • 并发编程之线程池的应用以及一些小细节的详细解析
  • 基于JSP的农产品供销服务系统
  • redis之主从复制、哨兵模式
  • 【随笔】Git 基础篇 -- 分支与合并 git rebase(十)
  • 图像识别技术在体育领域的应用
  • 【项目新功能开发篇】开发编码
  • 软件设计原则:开闭原则
  • Python如何下载视频
  • 使用虚拟引擎为AR体验提供动力
  • Kafka入门到实战-第五弹
  • Ideal Holidays
  • Raven:一款功能强大的CICD安全分析工具
  • 【苹果MAC】苹果电脑 LOGI罗技鼠标设置左右切换全屏页面快捷键
  • IDE/VS2015和VS2017帮助文档MSDN安装和使用
  • 开启 Keep-Alive 可能会导致http 请求偶发失败
  • 【leetcode面试经典150题】4.删除有序数组中的重复项 II(C++)
  • 【LeetCode热题100】【普通数组】合并区间
  • 自我认识的方法模型图
  • dhcp和dhcp中继代理