当前位置: 首页 > news >正文

java Flink(四十二)Flink的序列化以及TypeInformation介绍(源码分析)

Flink的TypeInformation以及序列化

TypeInformation主要作用是为了在 Flink系统内有效地对数据结构类型进行管理,能够在分布式计算过程中对数据的类型进行管理和推断。同时基于对数据的类型信息管理,Flink内部对数据存储也进行了相应的性能优化。

Flink 数据类型 & TypeInformation信息_flink typeinformation-CSDN博客

每一个具体的数据类型都对应一个TypeInformation的具体实现,每一个TypeInformation都会为对应的具体数据类型提供一个专属的序列化器。通过 Flink的序列化过程图可以看到TypeInformation会提供一个createSerialize()方法,通过这个方法就可以得到该类型进行数据序列化操作与反序化操作的对象TypeSerializer。
Flink 数据序列化_flink的序列化-CSDN博客

可以看出,TypeInformation在flink的序列化中起了很重要的作用

源码分析

Basic类型

Flink建议通过Pojo进行数据传入,如果传入的数据类型不满足Pojo条件或者不是Flink支持的基础类型,那么就会通过Kryo进行序列化,效率较低

创建一个包含给定元素的新数据流。元素都必须是相同的类型

(先看基本类型的数据传入)

ctrl+左键点击进入

TypeExtractor:一种用于对类进行反射分析的实用程序,用于确定转换函数实现的返回类型。

初始化 TypeInformation 根据数据第一个元素进行判断返回类型

 传入第一个元素

 

 ctrl+左键点击红框方法进入

如果用于此类型或超类型,则使用工厂创建类型信息。否则返回null。

检查我们是否可以从元组中提取类型,否则使用该类

同上,如果是Row类型,则进入该代码块 

 显然我们这次的例子是Basic 中的String类型,所以进入 privateGetForClass

从给定的类(如Integer、String[]或POJO)中创建类型信息。

检查是否可以使用工厂生产类型信息

 对象作为泛型类型信息处理,这里返回的 GenericTypeInfo 就是Flink定义的泛型类型的TypeInfo

如果类型满足,则返回泛型

 如果类型为数组,则进入

如果类型为hadoop writable则进入

 

如果是Basic类型的一种,则命中

显然我们的String类型数据命中了Basic

一路返回到 fromElements,typeInfo里的信息包含了选择序列化的类型

 进入fromCollection:从给定的非空集合创建数据流。

 不能有null元素和混合元素

 最终返回的DataStreamSource数据,typeInfo数据被封装到了其中

Pojo类型

 跟Basic类一样,一步一步进入到privateGetForClass

经过一堆判断,都没有命中后走到pojo类判断

 

判断必须是Public类型类

不能全都是static或者transient字段

  循环读取每个field,字段必须有Get、Set方法

 每个字段创建对应的typeInfo添加到pojoFields

 最后返回的DataStream,可以看到Pojo的每个字段以及字段对应的序列化类型都包装进去

http://www.lryc.cn/news/322927.html

相关文章:

  • 社科赛斯考研:二十二载岁月铸辉煌,穿越周期的生命力之源
  • 【视频图像取证篇】模糊图像增强技术之锐化类滤波场景应用小结
  • win10 禁止谷歌浏览器自动更新(操作贼简单)
  • LeetCode每日一题【24. 两两交换链表中的节点】
  • jeecg启动Sentinel 一直是空白页面 解决办法用 外部 Sentinel SpringCloud之Sentinel概述和安装及简单整合
  • 易基因:人类大脑的单细胞DNA甲基化和3D基因组结构|Science
  • Nginx中设置反向代理
  • 无线局域网——wlan
  • ASP.NET 服务器控件
  • [数据集][目标检测]麻雀检测数据集VOC+YOLO格式1157张1类别
  • 嵌入式学习第二十九天!(数据结构的概念、单向链表)
  • 【ZooKeeper】2、安装
  • 通过Pytest 多数据库连接实例了解Python工厂模式与单例模式的区别
  • 超拟人语音合成上线,打造有温度的交互新体验
  • word 及PPT 中修改公式字体
  • 将数据转换成xml格式的文档并下载
  • 深入理解与实践AB测试:从理论到实战案例解析
  • flask之请求钩子
  • COPY requires at least two arguments, docker COPY 报错
  • 权限提升-Web权限提升篇划分获取资产服务后台系统数据库管理相互转移
  • 【Unity每日一记】unity中的内置宏和条件编译(Unity内置脚本符号)
  • 发现有一个会Python的男友魅力值杠杠的!!!
  • SQL日期函数
  • C语言经典面试题目(二十六)
  • 创建一个electron-vite项目
  • Codeforces Round 935 (Div. 3)A~E
  • ES: spring boot中使用ElasticsearchClient
  • 实体框架EF(Entity Framework)简介
  • 使用CUDA 为Tegra构建OpenCV
  • YoloV8改进策略:BackBone改进|PKINet