当前位置: 首页 > news >正文

【从零学习python 】55.Python中的序列化和反序列化,JSON与pickle模块的应用

文章目录

  • 序列化和反序列化
    • JSON模块
    • pickle模块
    • 进阶案例

序列化和反序列化

通过文件操作,我们可以将字符串写入到一个本地文件。但是,如果是一个对象(例如列表、字典、元组等),就无法直接写入到一个文件里,需要对这个对象进行序列化,然后才能写入到文件里。

设计一套协议,按照某种规则,把内存中的数据转换为字节序列,保存到文件,这就是序列化,反之,从文件的字节序列恢复到内存中,就是反序列化。

Python中提供了JSONpickle两个模块用来实现数据的序列化和反序列化。

JSON模块

JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式,它基于 ECMAScript 的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。JSON的本质是字符串!

使用JSON实现序列化
JSON提供了dumpdumps方法,将一个对象进行序列化。

dumps方法的作用是把对象转换成为字符串,它本身不具备将数据写入到文件的功能。

import json
file = open('names.txt', 'w')
names = ['zhangsan', 'lisi', 'wangwu', 'jerry', 'henry', 'merry', 'chris']
# file.write(names)  出错,不能直接将列表写入到文件里# 可以调用 json的dumps方法,传入一个对象参数
result = json.dumps(names)# dumps 方法得到的结果是一个字符串
print(type(result))  # <class 'str'># 可以将字符串写入到文件里
file.write(result)file.close()

dump方法可以在将对象转换成为字符串的同时,指定一个文件对象,把转换后的字符串写入到这个文件里。

import jsonfile = open('names.txt', 'w')
names = ['zhangsan', 'lisi', 'wangwu', 'jerry', 'henry', 'merry', 'chris']# dump方法可以接收一个文件参数,在将对象转换成为字符串的同时写入到文件里
json.dump(names, file)
file.close()

注意:如果是一个空对象,调用dumps方法转换成为一个JSON对象,得到的结果是null(JS里的空对象)

json.dumps(None)  # null

使用JSON实现反序列化
使用loadsload方法,可以将一个JSON字符串反序列化成为一个Python对象。

loads方法需要一个字符串参数,用来将一个字符串加载成为Python对象。

import json# 调用loads方法,传入一个字符串,可以将这个字符串加载成为Python对象
result = json.loads('["zhangsan", "lisi", "wangwu", "jerry", "henry", "merry", "chris"]')
print(type(result))  # <class 'list'>

load方法可以传入一个文件对象,用来将一个文件对象里的数据加载成为Python对象。

import json# 以可读方式打开一个文件
file = open('names.txt', 'r')# 调用load方法,将文件里的内容加载成为一个Python对象
result = json.load(file)print(result)
file.close()

pickle模块

和json模块类似,pickle模块也有dumpdumps方法可以对数据进行序列化,同时也有loadloads方法进行反序列化。区别在于,json模块是将对象转换成为字符串,而pickle模块是将对象转换成为二进制。

pickle模块里方法的使用和json里方法的使用大致相同,需要注意的是,pickle是将对象转换成为二进制,所以,如果想要把内容写入到文件里,这个文件必须要以二进制的形式打开。

区别(了解)
思考: json和pickle两个模块都可以将对象进行序列化和反序列化,那它们有哪些区别,在使用场景上又该如何选择?

  • json模块:

将对象转换成为字符串,不管是在哪种操作系统,哪种编程语言里,字符串都是可识别的。

json就是用来在不同平台间传递数据的。

并不是所有的对象都可以直接转换成为一个字符串,下标列出了Python对象与json字符串的对应关系。

PythonJSON
dictobject
list, tuplearray
strstring
int, floatnumber
Truetrue
Falsefalse
Nonenull

如果是一个自定义对象,默认无法装换成为json字符串,需要手动指定JSONEncoder。

如果是将一个json串重新转换成为对象,这个对象里的方法就无法使用了。

import jsonclass MyEncode(json.JSONEncoder):def default(self, o):# return {"name":o.name,"age":o.age}return o.__dict__class Person(object):def __init__(self, name, age):self.name = nameself.age = agedef eat(self):print(self.name+'正在吃东西')p1 = Person('zhangsan', 18)# 自定义对象想要转换成为json字符串,需要给这个自定义对象指定JSONEncoder
result = json.dumps(p1, cls=MyEncode)
print(result)  # {"name": "zhangsan", "age": 18}# 调用loads方法将对象加载成为一个对象以后,得到的结果是一个字典
p = json.loads(result)
print(type(p))
  • pickle模块:

pickle序列化是将对象按照一定的规则转换成为二进制保存,它不能跨平台传递数据。
pickle的序列化会将对象的所有数据都保存。

进阶案例

【Python】Python 实现猜单词游戏——挑战你的智力和运气!

【python】Python tkinter库实现重量单位转换器的GUI程序

【python】使用Selenium获取(2023博客之星)的参赛文章

【python】使用Selenium和Chrome WebDriver来获取 【腾讯云 Cloud Studio 实战训练营】中的文章信息

使用腾讯云 Cloud studio 实现调度百度AI实现文字识别

【玩转Python系列【小白必看】Python多线程爬虫:下载表情包网站的图片

【玩转Python系列】【小白必看】使用Python爬取双色球历史数据并可视化分析

【玩转python系列】【小白必看】使用Python爬虫技术获取代理IP并保存到文件中

【小白必看】Python图片合成示例之使用PIL库实现多张图片按行列合成

【小白必看】Python爬虫实战之批量下载女神图片并保存到本地

【小白必看】Python词云生成器详细解析及代码实现

【小白必看】Python爬取NBA球员数据示例

【小白必看】使用Python爬取喜马拉雅音频并保存的示例代码

【小白必看】使用Python批量下载英雄联盟皮肤图片的技术实现

【小白必看】Python爬虫数据处理与可视化

【小白必看】轻松获取王者荣耀英雄皮肤图片的Python爬虫程序

【小白必看】利用Python生成个性化名单Word文档

【小白必看】Python爬虫实战:获取阴阳师网站图片并自动保存

小白必看系列之图书管理系统-登录和注册功能示例代码

小白实战100案例: 完整简单的双色球彩票中奖判断程序,适合小白入门

使用 geopandas 和 shapely(.shp) 进行地理空间数据处理和可视化

使用selenium爬取猫眼电影榜单数据

图像增强算法Retinex原理与实现详解

爬虫入门指南(8): 编写天气数据爬虫程序,实现可视化分析

爬虫入门指南(7):使用Selenium和BeautifulSoup爬取豆瓣电影Top250实例讲解【爬虫小白必看】

爬虫入门指南(6):反爬虫与高级技巧:IP代理、User-Agent伪装、Cookie绕过登录验证及验证码识别工具

爬虫入门指南(5): 分布式爬虫与并发控制 【提高爬取效率与请求合理性控制的实现方法】

爬虫入门指南(4): 使用Selenium和API爬取动态网页的最佳方法

爬虫入门指南(3):Python网络请求及常见反爬虫策略应对方法

爬虫入门指南(2):如何使用正则表达式进行数据提取和处理

爬虫入门指南(1):学习爬虫的基础知识和技巧

深度学习模型在图像识别中的应用:CIFAR-10数据集实践与准确率分析

Python面向对象编程基础知识和示例代码

MySQL 数据库操作指南:学习如何使用 Python 进行增删改查操作

Python文件操作指南:编码、读取、写入和异常处理

使用Python和Selenium自动化爬取 #【端午特别征文】 探索技术极致,未来因你出“粽” # 的投稿文章

Python多线程与多进程教程:全面解析、代码案例与优化技巧

Selenium自动化工具集 - 完整指南和使用教程

Python网络爬虫基础进阶到实战教程

Python入门教程:掌握for循环、while循环、字符串操作、文件读写与异常处理等基础知识

Pandas数据处理与分析教程:从基础到实战

Python 中常用的数据类型及相关操作详解

【2023年最新】提高分类模型指标的六大方案详解

Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能

用4种回归方法绘制预测结果图表:向量回归、随机森林回归、线性回归、K-最近邻回归

http://www.lryc.cn/news/132915.html

相关文章:

  • 【C++】详解内存中的堆和栈
  • QCustomPlot横坐标为毫秒级的时间轴数据展示的实时刷新数据功能
  • STM32/AT32 MCO管脚输出时钟配置
  • “SRP模型+”多技术融合在生态环境脆弱性评价模型构建、时空格局演变分析与RSEI 指数的生态质量评价
  • 【大虾送书第六期】搞懂大模型的智能基因,RLHF系统设计关键问答
  • 超越函数界限:探索JavaScript函数的无限可能
  • PHP实现轻量级WEB服务器接收HTTP提交的RFID刷卡信息并回应驱动读卡器显示播报语音
  • Neo4j之with基础
  • 60页数字政府智慧政务大数据资源平台项目可研方案PPT
  • 循环神经网络RNN完全解析:从基础理论到PyTorch实战
  • 【SA8295P 源码分析】52 - 答疑之 QNX 创建镜像、Android修改CMDLINE
  • 网络安全法律
  • Redis缓存问题(穿透, 击穿, 雪崩, 污染, 一致性)
  • 网络时代拟态环境的复杂化
  • 湘潭大学 湘大 XTU OJ 1055 整数分类 题解(非常详细)
  • 什么是视频的编码和解码
  • LeetCode 2681. Power of Heroes【排序,数学,贡献法】2060
  • AVL树的讲解
  • Unity 之 Input类
  • 亚信科技AntDB数据库连年入选《中国DBMS市场指南》代表厂商
  • AMBA总线协议(3)——AHB(一)
  • Git commit与pull的先后顺序
  • HarmonyOS/OpenHarmony应用开发-ArkTS语言渲染控制ForEach循环渲染
  • Powered by Paraverse | 平行云助力彼真科技打造演出“新物种”
  • 企微配置回调服务
  • 机器人远程控制软件设计
  • 面试题-React(二):React中的虚拟DOM是什么?
  • 分布式链路追踪——Dapper, a Large-Scale Distributed Systems Tracing Infrastructure
  • 【IEEE会议】第二届IEEE云计算、大数据应用与软件工程国际学术会议 (CBASE2023)
  • Streamlit项目:基于讯飞星火认知大模型开发Web智能对话应用