当前位置: 首页 > news >正文

python如何完成对 Excel文件的解密后读取?

通常为了防止重要的Excel文件数据内容的泄露,需要对文件整体进行加密与解密的操作。

对于文件的加解密过程,python也有很多非标准库来帮助我们完成操作,这里主要说明如何完成对Excel文件的解密与读取操作。

这里我们使用到的是msoffcrypto-tool非标准库,可以选择使用pip的方式安装一下即可。

pip intall msoffcrypto-tool

该msoffcrypto-tool模块提供了代码层面的解密操作,也提供了CLI终端命令直接解密的操作。

1.使用终端命令

通过在终端命令行输入下面的命令即可完成对Office文件解密操作。

msoffcrypto-tool '加密文件路径' '解密文件路径' -p 123456

其中利用-p参数设置123456为解密文件需要的密码,可以使用该密码来完成解密操作。

2.使用python API

将示例中需要的解密的python模块都导入到当前的代码块中。

# Importing the pandas module and renaming it as pd.
import pandas as pd# Importing the msoffcrypto module and renaming it as pto.
import msoffcrypto as pto

开始进行解密操作之前,我们首先将加密后的excel原始文件读取为File文件对象。

# Opening the file in binary mode.
file_ = pto.OfficeFile(open('D:/test/data.xlsx', 'rb'))

其次,对File文件对象设置文件解密时需要的密码,使用load_key函数加载密码。

# Loading the password into the file object.
file_.load_key(password='123456')

然后,同样使用File文件对象的decrypt函数可以完成对Excel文件的解密操作。

# Decrypting the file and saving it to the path specified.
file_.decrypt(open('./data_decrypted.xlsx', 'wb'))

至此,文件解密过程已经完成了,接下来只需要对生成的没有密码的新文件进行操作就可以了。

这里我们使用常用的pandas模块完成了对数据的读取操作就OK了。

# Reading the excel file and storing it in a dataframe.
data_frame = pd.read_excel('./data_decrypted.xlsx')# Printing the dataframe.
print(data_frame)

关于更多的详细内容可以参考github上面作者对于msoffcrypto相关的详细说明。

https://github.com/nolze/msoffcrypto-tool
往期精彩

python最好用的能源类可视化图表模块,没有之一!

如何解决python读取大数据量文件时造成的内存溢出?

python情感分析:基于jieba的分词及snownlp的情感分析!

http://www.lryc.cn/news/5746.html

相关文章:

  • 微服务实战--高级篇:RabbitMQ高级
  • autoCAD2022 - 设置新的原点
  • spring boot 配置 mybatis-plus多数据源
  • 独立产品灵感周刊 DecoHack #047 - 安卓手机上最有用的APP
  • 【面试题】JavaScript中递归的理解
  • PyTorch学习笔记
  • SpringBoot2知识点记录
  • Mysql
  • Q4营收利润增长背后估值持续偏低,全球支付巨头PayPal前景如何?
  • 【自然语言处理】【大模型】BLOOM:一个176B参数且可开放获取的多语言模型
  • 小红书穿搭博主推广费用是多少?
  • 网络安全-PHPstudy环境搭建
  • operator的两种用法(重载和隐式类型转换)
  • vue常用指令
  • MATLAB | 有关数值矩阵、颜色图及颜色列表的技巧整理
  • C++模板元编程详细教程(之九)
  • PhysioNet2017分类的代码实现
  • 正大期货本周财经大事抢先看
  • html+css综合练习一
  • 安装jdk8
  • 二分法心得
  • Linux安装Docker完整教程
  • 备份基础知识
  • C++学习记录——팔 内存管理
  • Spring事务失效原因分析解决
  • 4个月的测试经验,来面试就开口要17K,面试完,我连5K都不想给他.....
  • python学习之pyecharts库的使用总结
  • 【taichi】利用 taichi 编写深度学习算子 —— 以提取右上三角阵为例
  • 二进制 k8s 集群下线 worker 组件流程分析和实践
  • Bean的六种作用域