当前位置: 首页 > news >正文

使用Python对excel中的数据进行处理

一、读取excel中的数据

首先引入pandas库,没有的话使用控制台安装 —— pip install pandas

import pandas as pd     #引入pandas库,别名为pd#read_excel用于读取excel中的数据,这里只列举常用的两个参数(文件所在路径,忽略头字段)
data = pd.read_excel('excel路径', header = 0)
print(data)  #可以打印看看自己读取的数据

read_excel的具体参数,可根据实际需要选择。

二、转换和处理数据

如果想对excel中读取的数据进行处理,最好把它转换成list,输出的时候使用dataFrame。

#输入之后转换一维数组
data = datas.values  #只读取excel中的值,不读取序号
data = list(np.concatenate(data.reshape((-1, 1), order="F")))  #转换
print(list)  #查看数组#其他处理代码……#输出的时候,定义一个空的dataFrame,把数据添加到dataFrame中
df = pd.DataFrame()  #定义空的dataFrame
#通过循环将数据添加到df
for i in data:df = df.append([i])   #把数据添加到末尾

三、将数据输出到excel

输出同样只要一行简单代码,使用dataFrame格式将数据输出到表格。

#to_excel用于输出excel中的数据,这里同样只列举两个常用参数(文件输出路径,忽略头字段)
df.to_excel('输出路径', index = False)

to_excel的具体参数,可根据实际需要选择。

四、使用pyhon处理excel数据的简单示例(含详细注释)

示例中的excel只有一列数据,主要作用处理是读取excel中的数据将之提取为纯中文字符串——使用正则表达式匹配。

大家可以根据自己的实际需要对数据进行转换和处理。

import pandas as pd
import numpy as np
import re  #正则datas = pd.read_excel('old.xlsx', header = 0)  #从excel中读取数据(这里使用的是相对路径)data = datas.values  #只读取excel中的值,不读取序号resource = list(np.concatenate(data.reshape((-1, 1), order="F")))  #将读取的数据转换为list# print(resource)  #打印list#提取中文字符串函数
def chinese(s):# res = re.findall('[^0-9]', s)  #使用正则表达式匹配非数字的字符res = re.findall('[\u4e00-\u9fa5]', s)      #使用正则表达式匹配中文字符return ''.join(res)     #将字符拼接成字符串df = pd.DataFrame()  #定义空的dataFrame#依次读取list中的数据,将之处理为纯中文字符串
for i in resource:i = str(i)      #excel中的部分数据为非字符串,这里全部转换为字符串ch = chinese(i)     #提取中文字符串df = df.append([ch])   #将数据添加到dfdf.to_excel('new.xlsx', index = False)  #将处理后的数据输出到excel表格

http://www.lryc.cn/news/23242.html

相关文章:

  • TCP协议原理三
  • mac在命令行里获取root权限
  • 文献阅读 Improving Seismic Data Resolution with Deep Generative Networks
  • mysql数据库之子查询练习
  • 西电计算机通信与网络(计网)简答题计算题核心考点汇总(期末真题+核心考点)
  • 【博学谷学习记录】超强总结,用心分享丨人工智能 Python基础 个人学习总结之列表排序
  • 深度讲解React Props
  • WebRTC现状以及多人视频通话分析
  • 【Windows】Windows下wget的安装与环境变量配置
  • 密码学基础概念
  • 科技巨头争相入局,卫星通信领域将迎来怎样的发展?
  • 银行软件测试面试题目总结,希望可以帮到你
  • MySQL数据定义
  • 跨设备文件传输工具横评
  • Oracle通过SQL找出ID不连续的位置
  • 学习一个Java项目
  • 《数据库系统概论》学习笔记——第三章 关系数据库标准语言SQL
  • linux shell 入门学习笔记17 mysql脚本开发
  • 产品新说 | 指标的异常检测怎么做,能更好配合业务变化(二)
  • 华为OD机试题,用 Java 解【最短耗时】问题
  • mysql数据库常见面试题
  • 【Android源码面试宝典】MMKV从使用到原理分析(一)
  • 你真的懂动态库吗?一文详解动态库的方方面
  • I.MX6ULL内核开发12:使用设备树插件实现RGB灯驱动
  • 大家一起来找茬,新手第一次layout到底能挑出多少毛病?
  • Java集合概述(Collection集合)
  • 运动无线蓝牙耳机哪款好、运动无线蓝牙耳机推荐
  • 解决AAC音频编码时间戳的计算问题
  • Android 9.0 添加自定义开机广播
  • 第四阶段10-添加类别,类别列表mapper层,service层,controller层