当前位置: 首页 > news >正文

湖仓一体-Paimon篇-简介

什么是Paimon?

2021年末,Flink官方提出打造一个全新的存储 Flink Table Store,一个 Flink 完全内置的存储。
为了让 Flink Table Store 能够有更大的发展,Flink PMC经过讨论决定将其捐赠Apache进行独立孵化。
2023 年 3 月 12 日,Flink Table Store 项目顺利通过投票,正式进入 Apache 软件基金会的孵化器,改名为 Apache Paimon。
Paimon 基于数据湖 + LSM,有很强的 Upsert 更新能力。

能力简介

Apache Paimon 是一种数据湖的格式,支持使用 Flink 和 Spark 构建实时湖仓架构,用于流式和批处理操作。Paimon 创新性地结合了数据湖格式和LSM结构,将实时流式更新引入数据湖架构。
Paimon 提供以下核心功能:
● 实时更新:
○ 主键表支持大规模更新的写入,具有非常高的实时性,通常通过Flink Streaming进行。
○ 支持合并引擎,支持按规则更新记录。规则:删除重复项以保留最后一行、部分更新、聚合记录或保留第一行等
○ 支持定义changelog-producer,为合并引擎的更新生成正确、完整的changelog。
● 大量附加数据处理:
○ 附加表(无主键)提供大规模批处理和流处理能力,自动小文件合并。
○ 支持通过 z-order 排序进行数据压缩以优化文件布局,并使用 minmax 等索引提供基于数据跳过的快速查询。
● 数据湖功能:
○ 可扩展的元数据:支持存储Petabyte大规模数据集,支持存储大量分区。
○ 支持 ACID 事务、时间旅行和模式演变。

Apache Paimon 的架构

在这里插入图片描述

如上架构图所示:
读/写: Paimon 支持多种方式来读取/写入数据和执行 OLAP 查询。
● 对于读取,它支持消费数据
○ 从历史快照(批处理模式)
○ 从最新偏移量(在流模式下)
○ 以混合方式读取增量快照。
● 对于写入,它支持
○ 来自数据库变更日志的流式同步(CDC)
○ 从离线数据批量插入/覆盖。
生态系统:除了 Apache Flink,Paimon 还支持其他计算引擎的读取,例如 Apache Hive、Apache Spark 和 Trino。
内部的:
● 在底层,Paimon 将列式文件存储在文件系统/对象存储中
● 文件的元数据保存在manifest文件中,提供大规模存储和数据跳过。
● 对于主键表,采用LSM树结构,支持大量数据更新和高性能查询。

http://www.lryc.cn/news/438396.html

相关文章:

  • React Native 0.76版本发布
  • yolo自动化项目实例解析(一)日志格式输出、并发异步多线程、websocket、循环截图、yolo推理、3d寻路
  • 获取无人机经纬度是否在指定禁飞区内
  • 解读:以RTC为基,AI为脑的“超拟人”AI实时互动解决方案
  • 软件测试学习笔记丨Postman基础使用
  • HTML5+CSS3面试题:(第一天)
  • 微信小程序中的模块化、组件化开发:完整指南
  • 9.第二阶段x86游戏实战2-初识易语言
  • Cortex-A7:__disable_irq和GIC_DisableIRQ、__enable_irq和GIC_EnableIRQ的区别(1)API介绍
  • MATLAB在嵌入式系统设计中的最佳实践
  • wpf 使用Oxyplot 库制作图表示例
  • CSS3中的@media查询
  • fly专享
  • 初识Linux · 进程(3)
  • 【spring】spring bean对象生命周期,spring容器如何管理bean,spring容器的名称是叫什么
  • 基于51单片机的电饭锅控制系统proteus仿真
  • 创建dataSource错误
  • 为解决bypy大文件上传报错—获取百度云文件直链并使用Aria2上传文件至服务器
  • 53.9k star 提升命令行效率的模糊搜索神器--fzf
  • 项目需求 | MySQL增量备份与恢复的完整操作指南
  • 判断当前环境是否为docker容器下
  • 深入理解FastAPI中的root_path:提升API部署灵活性的关键配置
  • QLORA:高效微调量化大型语言模型
  • CesiumJS+SuperMap3D.js混用实现可视域分析 S3M图层加载 裁剪区域绘制
  • Fish-Speech 部署安装指南
  • Excel 国产化替换新方案
  • 在职研生活学习--20240908
  • chattr:修改文件的特殊属性
  • vue-router 在新的标签页打开链接/路由
  • Ansys HFSS的边界条件与激励端口