当前位置: 首页 > news >正文

Python学习笔记:导入txt、xlsx文件并做简单函数处理

1.txt文件

        1.1路径

file_path = "E:\Python Project\temp.txt" 
with open(file_path) as f:content1 = f.read()

导入文件时,如果直接放文件绝对路径上去会报错,这是因为\P是转义字符

所以在绝对路径前面加r可以避免将引号内的内容识别成转义字符(在引号前加上f表示这是一个带有特殊格式的字符串,其中可以包含花括号{}及其中的表达式,其中{}内填充的就是表达式的值)

file_path = r"E:\Python Project\temp.txt" 
with open(file_path) as f:content1 = f.read()

或者可以直接使用相对路径

file_path = "temp.txt" 
with open(file_path) as f:content1 = f.read()

相对路径默认识别当前文件夹

        1.2文件读取

python读取文件可以采用

with open(file_path) as f:f.read()

 也可以写作,效果一样,当然open(file,'r')可以加上文件的读取属性

file_path = r"E:\Python Project\temp.txt"
f = open(file_path)

文件内容读取可以通过read、readline、readlines分别读取整个文件、一行、所有行并放在list中,之前读取过的内容后续不会再读出。

 2.xlsx文件

        2.1文件读取

可以使用panda库的excel_read()

import pandas
f = pandas.read_excel(r"E:\Python Project\1.xlsx")
print(f)

也可以直接使用xlrd库的open_workbook(),但是最新版本xlrd库删除了对xlsx的支持;

import xlrd
f = xlrd.open_workbook_xls(r"E:\Python Project\1.xlsx")

也可以使用openpyxl的load_workbook()

import openpyxl as xl
f = xl.load_workbook('1.xlsx')

3.练习:对文件数据进行简单的函数处理

xlsx文件中第一列和第二列数据的Pearson系数计算

import openpyxl
import pandas
import mathf = pandas.read_excel(r"E:\Python Project\1.xlsx")
data1 = f.values
print(type(data1))
sum_ans0 = 0
sum_ans1 = 0
for i in data1:sum_ans0 += i[0]sum_ans1 += i[1]
ave_ans0 = sum_ans0 / len(data1)
ave_ans1 = sum_ans1 / len(data1)
sum_final0 = 0
sum_final1 = 0
sum_final2 = 0
for temp_i in data1:sum_final0 += (temp_i[0] - ave_ans0) * (temp_i[1] - ave_ans1)sum_final1 += math.pow((temp_i[0] - ave_ans0), 2)sum_final2 += math.pow((temp_i[1] - ave_ans1), 2)
pearson = sum_final0/(math.sqrt(sum_final1) * math.sqrt(sum_final2))
print(f"Pearson={pearson}")

得到f后通过f.value得到数据的list,后续对list里面的数据进行遍历求解即可

通过openpyxl中sheet.cell也可以实现遍历

import openpyxl as xl
f = xl.load_workbook('1.xlsx')
sheet = f['Sheet1']
cell = sheet.cell(1, 1)
print(cell.value)
list_ans = []
for row in range(1, sheet.max_row + 1):list_ans.append([sheet.cell(row, 1).value, sheet.cell(row, 2).value])

        3.1 二维list的求和优化

上面这个练习涉及到了二维list需要对每个list的第一个数字和第二个数字分别对应求和

         3.1.1 for遍历

最简单的方式是直接for遍历list

import openpyxl
import pandas
import mathf = pandas.read_excel(r"E:\Python Project\1.xlsx")
data1 = f.values
print(type(data1))
sum_ans0 = 0
sum_ans1 = 0
for i in data1:sum_ans0 += i[0]sum_ans1 += i[1]

        3.1.2sum

 对多维度的list直接应用sum可以分别对应求和

import openpyxl
import pandas
import mathf = pandas.read_excel(r"E:\Python Project\1.xlsx")
data1 = f.values
print(type(data1))
sum_ans1 = sum(data1)

        3.2作图Barchart

import openpyxl as xl
from openpyxl.chart import BarChart, Reference
f = xl.load_workbook('1.xlsx')
sheet = f['Sheet1']
cell = sheet.cell(1, 1)
print(cell.value)
list_ans = []
for row in range(1, sheet.max_row + 1):list_ans.append([sheet.cell(row, 1).value, sheet.cell(row, 2).value])
plot_data = Reference(sheet, min_col=1, max_col=2, min_row=1, max_row=sheet.max_row)
chart = BarChart()
chart.add_data(plot_data)
sheet.add_chart(chart, 'c1')
f.save('1.xlsx')
http://www.lryc.cn/news/166190.html

相关文章:

  • uniapp 轮播列表左右滑动,滑动到中间放大
  • 5. 自动求导
  • 【IEEE会议】 第三届智能通信与计算国际学术会议(ICC 2023)
  • 巨人互动|Facebook海外户Facebook风控规则有什么
  • pip命令来查看当前激活的虚拟环境
  • STL stack 和 queue
  • 阈值回归模型(Threshold Regression Model)及R实现
  • 无人机通信协议MAVLink简介
  • 【办公自动化】用Python批量从上市公司年报中获取主要业务信息
  • 【sizeof()的使用方式】简洁明了初识C语言
  • 10. 正则表达式匹配
  • [Unity]GPU Instancing 无效的原因
  • 2023 年前端编程 NodeJs 包管理工具 npm 安装和使用详细介绍
  • ptmalloc源码分析 - Top chunk的扩容函数sysmalloc实现(09)
  • [BJDCTF2020]ZJCTF,不过如此 preg_replace /e模式漏洞
  • C++day4
  • 【LeetCode-简单题】541. 反转字符串 II
  • Linux服务使用宝塔面板搭建网站,并发布公网访问
  • 代码随想录算法训练营19期第48天
  • 【校招VIP】产品项目分析之竞品分析
  • 【JavaScript内置对象】Date对象,从零开始
  • idea启动缓慢解决办法
  • App测试中ios和Android有哪些区别呢?
  • Flink JobManager的高可用配置
  • 为什么Token手动添加到请求的Header中,通常使用“Authorization“字段?
  • 国际生态数据获取网络
  • 爬虫逆向实战(34)-某视综数据(MD5、AES)
  • 数据分析三剑客之Matplotlib
  • Python Opencv实践 - LBP特征提取
  • Docker 搭建Redis Cluster 集群