当前位置: 首页 > news >正文

深度学习中主要库的使用:(一)pandas,读取 excel 文件,支持主流的 .xlsx/.xls 格式

pandas

其中的 pd.read_excel() 函数可以读取 excel 文件,支持主流的 .xlsx/.xls 格式。

想要读取 .xlsx 文件就需要再安装 openpyxl 库,想要读取 .xls 文件就需要再安装 xlrd 库。

import pandas as pdfile_path = 'test1.xlsx'
data = pd.read_excel(path, engine='openpyxl')
print(data)

读取的结果是一个 DataFrame 对象,DataFramepandas 中用于处理表格数据的主要数据结构,它具有丰富的属性和方法,具体如下:

1)常用属性

  1. data.shape

    返回一个元组,表示 DataFrame 的维度(行数和列数)。

  2. data.columns

    返回一个 Index 对象,包含 DataFrame 的列标签。

  3. data.index

    返回一个 Index 对象,包含 DataFrame 的行标签。

  4. data.dtypes

    返回一个 Series,显示每列的数据类型。

  5. data.size

    返回 DataFrame 中元素的总数(行数乘以列数)。

  6. data.ndim

    返回 DataFrame 的维度数(通常是 2)。

  7. data.empty

    返回一个布尔值,指示 DataFrame 是否为空。

2)常用方法

  1. data.head(n)

    返回前 n 行数据(默认是 5 行)。

  2. data.tail(n)

    返回后 n 行数据(默认是 5 行)。

  3. data.describe()

    返回数值列的统计摘要(如计数、均值、标准差、最小值、四分位数、最大值)。

  4. data.info()

    打印 DataFrame 的简要摘要,包括行数、列数、列类型和非空值计数。

  5. data.isnull()

    返回一个布尔型 DataFrame,指示每个元素是否为 NaN

  6. data.dropna()

    删除包含 NaN 的行。

  7. data.fillna(value)

    用指定的值填充 NaN

  8. data.groupby(column)

    按指定列对 DataFrame 进行分组。

  9. data.pivot_table(values, index, columns)

    创建一个数据透视表。

  10. data.apply(func)

    沿 DataFrame 的轴应用函数。

3)示例

import pandas as pdfile_path = 'test1.xlsx'
data = pd.read_excel(file_path, engine='openpyxl')# 打印形状
print("Shape:", data.shape)
print("----------------------------")
# 打印列标签
print("Columns:", data.columns)
print("----------------------------")
# 打印前两行
print("Head:\n", data.head(2))# -------------------------------------------------------------------------------------------------------------------------
# 输出为:
Shape: (159, 6)
Columns: Index(['frame', 'point number', 'x', 'y', 'z', 'intensity'], dtype='object')
Head:frame  point number         x         y         z  intensity
0      0             0  1.507812 -0.339844  0.164062  22.174839
1      0             1  1.621094 -0.537109 -0.193359  27.379873

http://www.lryc.cn/news/613497.html

相关文章:

  • 房产证识别在房产行业的技术实现及应用原理
  • 超高车辆如何影响城市立交隧道安全?预警系统如何应对?
  • 网络基础概念
  • 基于Qt的Live2D模型显示以及控制
  • ora-01658 无法为表空间 users中的段创建initial区
  • RocketMQ架构解析
  • 遥感卫星领域的AI应用
  • Day03 学习git
  • LWIP网络接口管理
  • [airplay2] airplay2简略介绍
  • 二分查找算法,并分析其时间、空间复杂度
  • IIS7.5下的https无法绑定主机头,显示灰色如何处理?
  • 前后端加密传数据实现方案
  • [ java SE ] 多人聊天窗口1.0
  • 强光干扰下裂缝漏检率↓82%!陌讯轻量化模型在道路巡检的落地实践
  • redis--黑马点评--用户签到模块详解
  • JAVA,Maven继承
  • 力扣经典算法篇-46-阶乘后的零(正向步长遍历,逆向步长遍历)
  • Linux Shell为文件添加BOM并自动转换为unix格式
  • 数据分析——Pandas库
  • 什么是 TDengine IDMP?
  • 机试备考笔记 7/31
  • 学习设计模式《二十一》——装饰模式
  • 人生后半场:从广度到深度的精进之路
  • 设计模式中的行为模式
  • 多线程 future.get()的线程阻塞是什么意思?
  • tcpdump问题记录
  • 【多重BFS】Monsters
  • 【实时Linux实战系列】基于实时Linux的高频交易系统构建
  • 【C语言】深入理解编译与链接过程