当前位置: 首页 > news >正文

python拆分Excel文件

按Sheet拆分Excel 或 按照某一列的不同值拆分Excel。文档样式如下:
在这里插入图片描述
结果:红色是按照Sheet名拆出的,蓝色和橙色是某个Sheet按照某列的不同值拆分的。
在这里插入图片描述

代码:

# -*- coding: utf-8 -*-
"""
拆分excel文件——按照sheet个数拆分 或者 按照列值拆分
"""import pandas as pd 
import osdef split_excel_by_sheet(file_path1):# 获取文件名称file_name = os.path.basename(file_path1)# 获取文件大小file_size = os.path.getsize(file_path1)# 文件名和扩展类型分别获取file_name_1, file_extension = os.path.splitext(os.path.basename(file_path1))# 获取excel的sheet名org_excel = pd.ExcelFile(file_path1)print('文件全称:', file_name,';大小: ',file_size ,'字节')print('文件名称:', file_name_1, ';文件类型:', file_extension)print('所含sheet', org_excel.sheet_names)# 按照sheet拆分# 遍历sheetfor sheet_name in org_excel.sheet_names:# 读取每个sheet后,单独保存df = pd.read_excel(org_excel, sheet_name) # dtype='str' 可以避免过长的数值被转为科学计数法# 在当前路径下,使用原文件名和sheet名 重新命名新文件df.to_excel('.\\' + file_name_1 + '_' + sheet_name + '.xlsx', index=None)print('split_excel_by_sheet is OK')def split_excel_by_part(file_path1):# 获取文件名称file_name = os.path.basename(file_path1)# 获取文件大小file_size = os.path.getsize(file_path1)# 文件名和扩展类型分别获取file_name_1, file_extension = os.path.splitext(os.path.basename(file_path1))# 获取excel的sheet名org_excel = pd.ExcelFile(file_path1)print('文件全称:', file_name,';大小: ',file_size ,'字节')print('文件名称:', file_name_1, ';文件类型:', file_extension)print('所含sheet', org_excel.sheet_names)sheet_name = input("请输入要拆分的sheet名:")# 检测sheet名称if sheet_name in org_excel.sheet_names:print('将拆分', file_name,'的', sheet_name, '内容')# 读取sheet_name内容df1 = pd.read_excel(file_path1, sheet_name)# 获取其列名print('包含的列为' , df1.columns.tolist())by_column_name = input("请输入要根据哪个列拆分:")# 检测列名称if by_column_name in df1.columns.tolist():print('按照',by_column_name,'列拆分,提示:')# 查看by_column_name列的内容值by_column_name_values = df1[by_column_name].unique()print(by_column_name,'列中值包含',by_column_name_values,'。同一值单独拆分成一个文件')# 使用groupby方法根据'lesson'的值拆分DataFramegrouped = df1.groupby(by_column_name)# 现在grouped是一个GroupBy对象,可以迭代它来访问每个组for key, group in grouped:print(f"Group with key: {key}")print(group)# 按照lesson列的不同值单独存一个文件group.to_excel('.\\' + file_name_1 + '_' + sheet_name + '_' + key +'.xlsx', index=None)print('Finish!')else :print('输入的',by_column_name,'?!没有叫这个名的列!')else :print('输入的',sheet_name,',此sheet名称不存在!')if __name__ == '__main__':# 文件地址file_path1 = '.\excel数据拆分.xlsx'# 按照sheet拆# split_excel_by_sheet(file_path1) # 按照sheet进行拆分# 按照部分分split_excel_by_part(file_path1)
http://www.lryc.cn/news/500364.html

相关文章:

  • Python实现Excel中数据条显示
  • c#如何开发后端
  • 6.Vue------async/await详细的讲解---知识积累
  • Redis面试专题-持久化
  • 如何将快捷指令添加到启动台
  • ansible自动化运维(二)ad-hoc模式
  • 技术栈6:Docker入门 Linux入门指令
  • OPStack Optimism Layer2
  • Leetcode—1498. 满足条件的子序列数目【中等】
  • 生活大爆炸版石头剪刀布(洛谷P1328)
  • OmniParser一种用于增强视觉语言模型与用户界面交互效果的技术
  • Unity引擎UI滚动列表——滚动复用基础介绍
  • 在 Windows 11 WSL (Ubuntu 24.04.1 LTS) | Python 3.12.x 下部署密码学库 charm
  • 【六足机器人】01功能开发
  • notepad++安装教程(超详细)
  • 创建简单的 PL/pgSQL 存储过程
  • Java项目实战II基于微信小程序的无中介租房系统(开发文档+数据库+源码)
  • Node.js实现WebSocket教程
  • Docker Compose实战一( 轻松部署 Nginx)
  • hive分区分桶、数据倾斜总结
  • unity打包到安卓帧率降低
  • 【Python3】装饰器 自动更新缓存
  • 通过EPEL 仓库,在 CentOS 7 上安装 OpenResty
  • [RabbitMQ] RabbitMQ常见应用问题
  • 每日速记10道java面试题13-MySQL篇
  • 乐鑫科技嵌入式面试题及参考答案(3万字长文)
  • Leetcode 每日一题 56.合并区间
  • 【Vue】v-model、ref获取DOM
  • Python 类的设计(以植物大战僵尸为例)
  • python中权重剪枝,低秩分解,量化技术 代码