当前位置: 首页 > news >正文

使用pandas、xlrd、openpyxl读取Excel

首先创建一个示例Excel文件example.xlsx,其中包含以下数据:

NameAgeGender
Alice28Female
Bob35Male
Charlie42Male
Dave29Male
Eve31Female

安装

pip install pandas
pip install xlrd
pip install openpyxl

方法一:使用Pandas库

  • 使用Pandas库来读取Excel文件并将其转换为字典格式。这是最简单和最常用的方法。

    import pandas as pd# 读取Excel文件
    excel_file = 'example.xlsx'
    sheet_name = 'Sheet1'# 使用Pandas读取Excel文件
    data_frame = pd.read_excel(excel_file, sheet_name=sheet_name)# 将数据转换为字典格式
    data_dict = data_frame.to_dict(orient='records')print(data_dict)
    
  • 输出结果:

    [{'Name': 'Alice', 'Age': 28, 'Gender': 'Female'}, {'Name': 'Bob', 'Age': 35, 'Gender': 'Male'}, {'Name': 'Charlie', 'Age': 42, 'Gender': 'Male'}, {'Name': 'Dave', 'Age': 29, 'Gender': 'Male'}, {'Name': 'Eve', 'Age': 31, 'Gender': 'Female'}]
    

方法二:使用xlrd库

  • 示例代码

    import xlrd# 读取Excel文件
    excel_file = 'example.xlsx'
    sheet_name = 'Sheet1'# 使用xlrd读取Excel文件
    workbook = xlrd.open_workbook(excel_file)
    sheet = workbook.sheet_by_name(sheet_name)# 将数据转换为字典格式
    data_dict = []
    for row in range(1, sheet.nrows):row_data = {}for col in range(sheet.ncols):cell_value = sheet.cell_value(row, col)row_data[sheet.cell_value(0, col)] = cell_valuedata_dict.append(row_data)print(data_dict)
    
  • 输出结果:

    [{'Name': 'Alice', 'Age': 28.0, 'Gender': 'Female'}, {'Name': 'Bob', 'Age': 35.0, 'Gender': 'Male'}, {'Name': 'Charlie', 'Age': 42.0, 'Gender': 'Male'}, {'Name': 'Dave', 'Age': 29.0, 'Gender': 'Male'}, {'Name': 'Eve', 'Age': 31.0, 'Gender': 'Female'}]
    

方法三:使用openpyxl库

  • 示例代码

    from openpyxl import load_workbook# 读取Excel文件
    excel_file = 'example.xlsx'
    sheet_name = 'Sheet1'# 使用openpyxl读取Excel文件
    workbook = load_workbook(filename=excel_file)
    worksheet = workbook[sheet_name]# 将数据转换为字典格式
    data_dict = []
    for row in worksheet.iter_rows(min_row=2, max_col=worksheet.max_column, values_only=True):row_data = {}for i, value in enumerate(row):row_data[worksheet.cell(row=1, column=i+1).value] = valuedata_dict.append(row_data)print(data_dict)
    
  • 输出结果:

    [{'Name': 'Alice', 'Age': 28.0, 'Gender': 'Female'}, {'Name': 'Bob', 'Age': 35.0, 'Gender': 'Male'}, {'Name': 'Charlie', 'Age': 42.0, 'Gender': 'Male'}, {'Name': 'Dave', 'Age': 29.0, 'Gender': 'Male'}, {'Name': 'Eve', 'Age': 31.0, 'Gender': 'Female'}]
    

总结

  • 可以看出使用Pandas库的方法最为简单,而使用xlrd和openpyxl库则需要手动处理每一行的数据。

  • 需要注意的是,以上示例代码仅适用于Excel文件中只有一个工作表的情况。如果Excel文件中有多个工作表,需要指定要读取的工作表。

  • 如果需要处理大量的Excel文件,建议使用Pandas库,因为它能够自动处理大部分数据类型,并且具有优秀的性能。如果只需要处理少量的Excel文件,可以考虑使用xlrd或openpyxl库。

http://www.lryc.cn/news/63637.html

相关文章:

  • Java面试题接口
  • 内存取证小练习-基础训练
  • 【Android -- 开源库】数据库 Realm 的基本使用
  • 基于el-input的数字范围输入框
  • 车联网OTA安全实践
  • 智融合·共未来丨智合同携手百融云创打造合同智能化应用服务平台
  • iOS ARC
  • 【代码随想录】刷题Day13
  • playwright连接已有浏览器操作
  • 深度学习模型评估简单介绍
  • PyTorch——利用Accelerate轻松控制多个CPU/GPU/TPU加速计算
  • 4个很多人都不知道的现代JavaScript技巧
  • 【Java笔试强训 19】
  • JPA整合达梦数据库
  • 制药专业转行软件测试,带我的师傅在这干了两年半,最终还是跑路了......
  • 「SQL面试题库」 No_53 项目员工II
  • Ruby适用于什么类型的开发
  • Mysql数据库的备份恢复
  • C++ 使用动态内存创建一个类
  • 2023年华中杯选题人数公布
  • 【黑马旅游案例记录(结合ES)】
  • 基于 A* 搜索算法来优化无线传感器节点网络的平均电池寿命(Matlab代码实现)
  • 三款自研AI应用引领未来,重塑行业新风尚
  • Kafka的命令行操作
  • 递归,回溯,分治(C++刷题笔记)
  • CentOS 7.6更改yum源
  • 三、进度管理
  • 基于LEACH和HEED的WSN路由协议研究与改进(Matlab代码实现)
  • ChatGPT镜像站收集【Free ChatGPT】(一)
  • PHP面试宝典之Mysql数据库基础篇