当前位置：首页 > article >正文

一周学会Pandas2 Python数据处理与分析-Pandas2数据合并与对比-pd.concat()：轴向拼接

article 2025/8/28 17:50:34

锋哥原创的Pandas2 Python数据处理与分析视频教程：

2025版 Pandas2 Python数据处理与分析视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili

在数据分析中，数据往往分散在多个来源（如不同文件、数据库表或API），需要通过合并整合为统一视图。同时，数据清洗、版本更新或业务验证时，常需对比数据差异以确保一致性。

一般有这样几种情况：

一是两份数据的列名完全相同，把其中一份数据追加到另一份的后面；

二是两份数据的列名有些不同，把这些列组合在一起形成多列；

三是以上两种情况混合。同时，在合并过程中还需要做些计算。

Pandas提供的各种功能能够轻而易举地完成这些工作。

pd.concat()：轴向拼接

核心功能：

沿行（纵向）或列（横向）拼接多个 DataFrame，支持批量合并。 适用场景：结构相同的数据表合并（如多个 CSV 文件）、多维度数据堆叠。

基本语法：

pd.concat(objs,                 # 要合并的对象列表（如多个DataFrame）axis=0,               # 合并方向：0沿行（纵向），1沿列（横向）join='outer',         # 合并方式：'outer'保留所有列，'inner'保留共有列ignore_index=False,   # 是否重置索引（避免重复）keys=None,            # 添加层次化索引（标识来源）sort=False,           # 是否对列排序
)

参数详解

objs: 要拼接的 DataFrame 列表（必填，如 [df1, df2]）。
axis: 拼接方向，axis=0（默认，纵向堆叠），axis=1（横向拼接）。
ignore_index: 是否重置索引（默认 False，保留原索引）。
keys: 添加层级索引标识来源（如 keys=['A', 'B']）。
join: 对齐方式，join='outer'（默认，保留所有列），join='inner'（仅共有列）。

常用场景示例

1，纵向合并（默认 axis=0）

import pandas as pddf1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})result = pd.concat([df1, df2])

2，横向合并（axis=1）

result = pd.concat([df1, df2], axis=1)

3，处理索引重复

使用 ignore_index=True 重置索引：

result = pd.concat([df1, df2], ignore_index=True)

4，仅合并共有列（join='inner'）

若两个 DataFrame 列不完全一致：

df3 = pd.DataFrame({'A': [5, 6], 'C': [9, 10]})
result = pd.concat([df1, df3], join='inner')  # 仅保留共有列'A'

5，添加层次化索引（keys）

标识数据来源：

result = pd.concat([df1, df2], keys=['df1', 'df2'])

注意事项

索引问题：合并时默认保留原索引，可能导致重复，建议用 ignore_index=True 重置。
列名对齐：横向合并（axis=1）时，按行索引对齐，缺失值填充NaN。
性能优化：合并大量数据时，建议先预处理再合并，避免内存不足。

查看全文

http://www.lryc.cn/news/2385467.html

安卓原生兼容服务器

优化用户体验：拦截浏览器前进后退、刷新、关闭、路由跳转等用户行为并弹窗提示

横川机器人驱动器导入参数教程

大学生创新创业项目管理系统设计——数据库实验九

电磁场与电场、磁场的关系

Python爬虫实战：研究Newspaper框架相关技术

Kotlin MultiPlatform 跨平台版本的记账 App

PIO 中的赋值魔术，MOV 指令

[docker]更新容器中镜像版本

第十七次CCF-CSP算法（含C++源码）

打造一个支持MySQL查询的MCP同步插件：Java实现

黑马k8s（十五）

Axure项目实战：智慧运输平台后台管理端-订单管理1（多级交互）

解决 cursor 中不能进入 conda 虚拟环境

微信小程序请求扣子（coze）api的例子

C++ 实现二叉树的后序遍历与中序遍历构建及层次遍历输出

基于大模型的髋关节骨关节炎预测与治疗方案研究报告

qiankun解决的问题

JavaScript从入门到精通（一）

快速失败(fail-fast)和安全失败(fail-safe)的区别

虚拟环境中的PyQt5 Pycharm设置参考

AI 笔记 - 模型优化 - 注意力机制在目标检测上的使用

AUTOSAR图解==＞AUTOSAR_SRS_LIN

UML 时序图使用案例

华为昇腾使用ollama本地部署DeepSeek大模型

多态的总结

Windows 高分辨率屏幕适配指南：解决界面过小、模糊错位问题

tvalid寄存器的理解

C++八股 —— 手撕定时器

K8S-statefulset-mysql-ha