当前位置: 首页 > news >正文

解析Excel文件内容,按每列首行元素名打印出某个字符串的统计占比(超详细)

目录

1.示例: 

1.1 实现代码1:列数为常量

运行结果:

1.2 实现代码2:列数为变量

运行结果:


1.示例: 

开发需求:读取Excel文件,统计第3列到第5列中每列的"False"字段占比,统计第6列中的"Pass"字段占比,并按每列首行元素名打印出统计占比

1.1 实现代码1:列数为常量

        请确保替换`'your_excel_file.xlsx'`为你实际的Excel文件路径。这段代码会按每列首行元素名打印出第3列到第5列中每列的"False"字段占比,以及第6列中"Pass"字段的占比

#!/usr/bin/env python3
# _*_ coding : UTF-8 _*_
# 开发人员 :jly
# 开发时间 :2024/01/31 18:57:54
# 文件名称 :rate.py
# 开发工具 :Visual Studio Codeimport pandas as pd# 读取Excel文件
file_path = 'result.xlsx'  # 替换成你的Excel文件路径
df = pd.read_excel(file_path)# 定义一个函数用于计算占比
def calculate_percentage(column, target_value):return column.value_counts(normalize=True).get(target_value, 0) * 100def str_percentages():false_percentages = df.iloc[:, 2:5].apply(lambda col: calculate_percentage(col, False), axis=0) # 统计第3列到第5列中每列的"False"字段占比Fail_percentage = calculate_percentage(df.iloc[:, 5], 'Fail')  # 统计第6列中"Fail"字段占比return false_percentages, Fail_percentage# 打印结果
def print_rate():print("第3列到第5列中每列的\"False\"字段占比:")for column_name, percentage in zip(df.columns[2:5], str_percentages()[0]):print(f"False Rate Of {column_name}: {percentage:.2f}%")print("\n第6列中\"Fail\"字段占比:")print(f"Fail Rate Of Result: {str_percentages()[1]:.2f}%")if __name__ == '__main__':print_rate()

运行结果:

1.2 实现代码2:列数为变量

#!/usr/bin/env python3
# _*_ coding : UTF-8 _*_
# 开发人员 :jly
# 开发时间 :2024/01/31 18:57:54
# 文件名称 :rate.py
# 开发工具 :Visual Studio Codeimport pandas as pd# 读取Excel文件
file_path = 'result.xlsx'  # 替换成你的Excel文件路径
df = pd.read_excel(file_path)# 定义一个函数用于计算占比
def calculate_percentage(column, target_value):return column.value_counts(normalize=True).get(target_value, 0) * 100def str_percentages(col_R):false_percentages = df.iloc[:, 2:int("{}".format(col_R))].apply(lambda col: calculate_percentage(col, False), axis=0) # 统计第3列到第5列中每列的"False"字段占比Fail_percentage = calculate_percentage(df.iloc[:, int("{}".format(col_R))], 'Fail')  # 统计第6列中"Fail"字段占比return false_percentages, Fail_percentage# 打印结果
def print_rate(col_R):print("第3列到第col_R列中每列的\"False\"字段占比:")for column_name, percentage in zip(df.columns[2:int("{}".format(col_R))], str_percentages(col_R)[0]):print(f"False Rate Of {column_name}: {percentage:.2f}%")print("\n第col_R列中\"Fail\"字段占比:")print(f"Fail Rate Of Result: {str_percentages(col_R)[1]:.2f}%")if __name__ == '__main__':print_rate(5)  #col_R=最后一列数(6)-1

运行结果:

http://www.lryc.cn/news/292309.html

相关文章:

  • qt中遇到[Makfile.Debug:119:debug/app.res.o] Error 1的原因以及解决方法
  • pytorch调用gpu训练的流程以及示例
  • 学习Android的第一天
  • 回归预测 | Matlab实现CPO-LSTM【24年新算法】冠豪猪优化长短期记忆神经网络多变量回归预测
  • Typora导出html文件图片自动转换成base64
  • 『C++成长记』string使用指南
  • 硬件连通性测试:构建数字世界的无形基石
  • mysql的安装与卸载
  • 假期作业 2.2
  • 运维SRE-02 正则表达式、grep
  • 【SpringCloud】使用OpenFeign进行微服务化改造
  • DRV8313和L298N都是电机驱动,一个是驱动三相FOC无刷直流电机的,一个是驱动有刷电机,使stm32控制无刷电机简单入门知识
  • React16源码: React中event事件系统初始化源码实现
  • Qt6入门教程 15:QRadioButton
  • Json序列化和反序列化 笔记
  • 新媒体与传媒行业数据分析实践:从网络爬虫到文本挖掘的综合应用,以“中国文化“为主题
  • Visual Studio使用Git忽略不想上传到远程仓库的文件
  • Nginx简单阐述及安装配置
  • 【遥感入门系列】遥感分类技术之遥感解译
  • 解决:IDEA无法下载源码,Cannot download sources, sources not found for: xxxx
  • 什么是IDE,新手改如何选择IDE?
  • springBoot+Vue汽车销售源码
  • FPS游戏框架漫谈第五天
  • 83.如何设计高可用系统
  • Map和Set讲解
  • PHP集成开发环境 PhpStorm 2023 for mac中文激活版
  • 数学建模 - 线性规划入门:Gurobi + python
  • SpringBoot security 安全认证(二)——登录拦截器
  • 详解WebRTC rtc::Thread实现
  • 阿赵UE学习笔记——13、贴花