当前位置: 首页 > news >正文

pandas---使用教程

pd.read_csv()  函数的基本用法

import pandas as pd
df = pd.read_csv('path_to_file.csv')

读取指定路径的 CSV 文件,并将其转换为一个 DataFrame

其中,DataFrame是 Pandas 中用于处理二维表格数据的主要数据结构,类似于电子表格或者数据库中的表。


header

CSV 文件的第一行通常包含列名。如果数据没有列名,可以通过 header 参数指定:

df = pd.read_csv('path_to_file.csv', header=None)

默认header = 0,这意味着函数会将文件的第一行作为列名。

例如,假设有一个名为data.csv的文件,内容如下:

Name,Age,City
John,25,New York
Mary,30,Los Angeles

可以使用以下代码读取:

import pandas as pd
df = pd.read_csv("data.csv")
print(df.columns)

输出结果:

Index(['Name', 'Age', 'City'], dtype='object')

index_col

有时,CSV 文件中的某一列可以作为 DataFrame 的索引。通过 index_col 参数可以指定这一列:

df = pd.read_csv('path_to_file.csv', index_col='ID')
usecols

如果 CSV 文件列很多,但只需要读取其中的一部分列,可以使用 usecols 参数:

df = pd.read_csv('path_to_file.csv', usecols=['Column1', 'Column2'])

处理缺失值
默认情况下,pd.read_csv() 会将空值读取为 NaN。如果需要将空值替换为其他值,可以使用 na_values 参数。

处理不同的编码
如果 CSV 文件的编码不是 UTF-8,可以通过 encoding 参数指定正确的编码。

处理不均匀的数据
如果数据的分隔符不一致,可以使用正则表达式作为 sep 参数的值。

使用列名映射
如果列名不符合 DataFrame 的命名规则,可以通过 names 参数指定新的列名。

http://www.lryc.cn/news/576096.html

相关文章:

  • 解构SAP RISE与Cloud ERP授权新政:从许可模式到迁移策略的深度指南
  • (一)miniconda安装配置
  • Dubbo服务调用超时问题解决方案
  • Hyperledger Fabric 入门笔记(二十)Fabric V2.5 测试网络进阶之Tape性能测试
  • Linux tcp_info:监控TCP连接的秘密武器
  • 【RAG面试题】如何获取准确的语义表示
  • MCP-安全(代码实例)
  • ubuntu安装达梦数据库
  • Java8方法引用:简洁高效的编程利器
  • algorithm ——————》双指针(移动0 复写0 快乐数 装水问题 以及数组中找几个数和为指定的元组)
  • TCP四层模型:网络协议核心解密
  • WPF 3D 开发全攻略:实现3D模型创建、旋转、平移、缩放
  • HTTP协议中Connection: Keep-Alive和Keep-Alive: timeout=60, max=100的作用
  • Linux入门攻坚——49、高可用HA之corosync/pacemaker(2)
  • Linux命令行操作基础
  • 关于css的height:100%
  • JAVA-泛型通配符的上界和下界
  • UUDS—常见NRC及其含义
  • 中国双非高校经费TOP榜数据分析
  • ROS:录制相机、IMU、GNSS等设备数据
  • gRPC技术解析与python示例
  • 楼宇自控系统以智能化管控,全方位满足建筑节约、安全与可靠运行需求
  • 像素之外的智慧:Adobe AI在动态影像与云端协作中的进阶应用
  • 如何设置 Java 的环境变量
  • 23种设计模式——单例模式的暗黑面
  • LLaMA-Factory 对 omnisql 进行 ppo dpo grpo nl2sql任务 实现难度 时间 全面对比
  • 【.net core】【sqlsugar】在where条件查询时使用原生SQL
  • spring-ai 1.0.0 学习(十八)——MCP Server
  • 修复opensuse 风滚草rabbitmq的Error: :plugins_dir_does_not_exist问题
  • 【C语言】知识总结·指针篇