当前位置: 首页 > news >正文

2.pandas--读取文件夹中所有excel文件进行合并

文章目录

    • 代码
    • 对应的本地文件
      • 文件夹目录
      • 三个文件夹中的内容
        • test01.xlsx
        • test02.xlsx
        • test03.xlsx
      • 三个文件合并后得到merge.xlsx文件
        • 文件内容
      • 生成result.xlsx
        • 文件内容

代码

import glob
import pandas as pddf_merge = pd.DataFrame()  # 创建一个空的DataFramefolder_path = "合并/"  # 文件夹路径all_files = glob.glob(f"{folder_path}/*.xlsx")      # 读出文件夹下的所有文件for file in all_files:df = pd.read_excel(file, index_col=0)df_merge = pd.concat([df_merge, df], axis=0)    # 将文件夹中的每个文件依次合并到de_mergedf_merge = df_merge.sort_values(by="年龄")    # 按年龄排序默认升序
df_merge.to_excel("合并/merge.xlsx")  # 将合并后的数据写入本地# 将姓名和年龄 两列数据读出来
df = pd.read_excel("合并/merge.xlsx", usecols=["姓名", "年龄"])
# 将两列数据 去掉 行索引和列索引 存入到本地
df.to_excel("合并/result.xlsx", index=False, header=False)

对应的本地文件

文件夹目录

代码工程目录下,合并文件夹中的三个文件
在这里插入图片描述

三个文件夹中的内容

test01.xlsx

在这里插入图片描述

test02.xlsx

在这里插入图片描述

test03.xlsx

在这里插入图片描述

三个文件合并后得到merge.xlsx文件

可以看出合并后的文件已经按照年龄排好序了

df_merge.to_excel("合并/merge.xlsx")  # 将合并后的数据写入本地
文件内容

在这里插入图片描述

生成result.xlsx

将merge.xlsx文件中对应的姓名和年龄的列数据提取出来,去掉行索引和列索引后再存储到本地

# 将两列数据 去掉 行索引和列索引 存入到本地
df.to_excel("合并/result.xlsx", index=False, header=False)
文件内容

在这里插入图片描述

http://www.lryc.cn/news/429582.html

相关文章:

  • WPS Office两个严重漏洞曝光,已被武器化且在野利用
  • 基于Java爬取微博数据(五) 补充微博正文列表图片 or 视频 内容
  • 反射异常捕获 | InvocationTargetException 要用e.getCause()打印才能看到具体异常
  • 【计算机网络】网络版本计算器
  • 使用 Python 爬虫进行网站流量分析:Referer 头的利用
  • 梧桐数据库(WuTongDB):数据库技术中LL算法详解
  • 【秋招笔试】8.18大疆秋招(第一套)-后端岗
  • CSS 的text-size-adjust属性
  • 阿里MAXCOMPUTE数据专辑信息读取并同步数据表
  • rufus制作ubantu的U盘安装介质时,rufus界面上的分区类型选什么?
  • 【系统架构设计师-2018年】案例分析-答案及详解
  • linux驱动入门实验班——平台总线设备驱动模型和设备树
  • 零基础学习Python(六)
  • 微信小程序--31(todolist案例)
  • springboot项目使用本地依赖项,打包后出现NoClassDefFoundError的一种解决方法
  • Maven高级使用指南
  • windows docker 执行apt-get 权限问题
  • Linux系统信息排查
  • 《图解设计模式》笔记(四)分开考虑
  • Linux shell编程学习笔记74:sed命令——沧海横流任我行(中)
  • [数据集][目标检测]道路积水检测数据集VOC+YOLO格式2699张1类别
  • 不同路径
  • 【HTML】HTML学习之引入CSS样式表
  • shaushaushau1
  • 揭秘面试必备:高频算法与面试题全面解析
  • 设计模式-visit模式-在语法树的实践
  • ZK-Rollups测评
  • redis生产使用场景(一):并行流+二级缓存
  • EXCEL跨文件查询,指定条件列,返回满足条件的指定列
  • [数据集][目标检测]流水线物件检测数据集VOC+YOLO格式9255张26类别