当前位置: 首页 > news >正文

python实用脚本(六)—— pandas库的使用(生成、读取表格)

本期主题:
python的pandas使用


往期链接:

  • python实用脚本(一)—— 批量修改目标文件夹下的文件名
  • python实用脚本(二)—— 使用xlrd读取excel
  • python实用脚本(三)—— 通过有道智云API实现翻译
  • python实用脚本(四)—— 正则表达式
  • python实用脚本(五)——numpy的使用

文章目录

  • 1.pandas是什么
  • 2.Series实例
  • 3.DataFrame实例
  • 3.pandas使用csv
    • 1.使用 to_csv() 将DataFrame存储为csv
    • 2.使用 read_csv读


1.pandas是什么

pandas是python data analyze libray,是一个基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。

pandas主要有两种数据结构:

  • Series(一维数据),类似于一维数组的对象,由一组数据和一组与之相关的索引构成;
  • DataFrame(二维数据),表格型的数据结构,由行数据和列数据构成;

2.Series实例

Series类似于表格中的一列,可以保存任何数据类型

Series 由索引(index)和列元素组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

其中:

  • data:代表一组数据
  • index:数据索引标签,不指定则默认从0开始计数
  • dtype:数据类型,默认自己判断
  • name:设置这个series的name
  • copy:是否进行数据拷贝,默认为False

看一个实际例子:
在这里插入图片描述

3.DataFrame实例

DataFrame是一个表格型的数据结构,每一列可以有不同的值类型,每一列可以认为是 series.
在这里插入图片描述
使用list创建DataFrame

>>> data = [['Google',10],['Runoob',12],['Wiki',13]]
>>>
>>> df = pd.DataFrame(data,columns=['Site','Age'],dtype=float)
<stdin>:1: FutureWarning: Could not cast to float64, falling back to object. This behavior is deprecated. In a future version, when a dtype is passed to 'DataFrame', either all columns will be cast to that dtype, or a TypeError will be raised.
>>>
>>> print(df)Site   Age
0  Google  10.0
1  Runoob  12.0
2    Wiki  13.0

3.pandas使用csv

CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。

1.使用 to_csv() 将DataFrame存储为csv

import numpy as np
import pandas as pd# name
name = ['xiaoming', 'xiaohong', 'xiaolv']
# age
age = [10, 12, 13]
dict = {'name' : name,'age' : age
}
df = pd.DataFrame(dict)df.to_csv('test.csv', index=False) #index=False就是不要最前面的那个索引

结果:
在这里插入图片描述

2.使用 read_csv读

df = pd.read_csv('test.csv')print(df.to_string())

测试结果:

python .\pandas_test.pyname  age
0  xiaoming   10
1  xiaohong   12
2    xiaolv   13
http://www.lryc.cn/news/11688.html

相关文章:

  • 字符集、ASCII、GBK、UTF-8、Unicode、乱码、字符编码、解码问题等
  • Java 布隆过滤器
  • vscode连接服务器(腾讯云)
  • IOS崩溃文件符号化实践
  • 设计模式之适配器模式与桥接模式详解和应用
  • Winform控件开发(14)——NotifyIcon(史上最全)
  • Verilog 学习第四节(从计数器到可控制线性序列机——LED实验进化六部曲)
  • 操作SSH无密登录配置
  • Websocket详细介绍
  • 大数据书单(100本)
  • python实战应用讲解-【语法基础篇】初识Python(附示例代码)
  • 【2023保研夏令营】网安、CS(西交、华师、科、南等)
  • Qt COM组件导出源文件
  • 各数据库数据类型的介绍和匹配
  • Rancher 部署 MySQL
  • Python语言零基础入门教程(二十五)
  • 蓝桥杯算法训练合集十五 1.打翻的闹钟2.智斗锅鸡3.文件列表
  • CPU扫盲-CPU与指令集
  • VINS-Mono/Fusion与OpenCV去畸变对比
  • jmx prometheus引起的一次cpu飙高
  • Android 虚拟 A/B 详解(六) SnapshotManager 之状态数据
  • Python快速入门系列之一:Python对象
  • 【博客626】不同类型的ARP报文作用以及ARP老化机制
  • nacos discovery和config
  • 【算法数据结构体系篇class06】:堆、大根堆、小根堆、优先队列
  • 试题 算法提高 最小字符串
  • 已解决ImportError: cannot import name ‘featureextractor‘ from ‘radiomics‘
  • 乡村振兴研究:全网最全指标农村经济面板数据(2000-2021年)
  • C语言中用rand()函数产生一随机数
  • 关于系统架构