当前位置: 首页 > news >正文

paimon中的Tag

TAG

在传统数仓场景中,从传统数据库中导入的事实表数据一般是全量导入,按天分区每天都存储一份全量数据,paimon对此提供了Tag机制,创建TAG时,会对当前数据做一份全量快照,在之后对表的数据进行更新也不会影响已经打完TAG的数据。
其实就是对当前的数据做镜像,或者说做备份

维护创建

https://paimon.apache.org/docs/0.9/maintenance/manage-tags/

-- 创建
bin/flink run \
lib/paimon-flink-action-0.9.0.jar \
create_tag \
--warehouse file:///data/soft/paimon/catalog \
--database default \
--table t_tags \
--tag_name first_tag-- 删除
bin/flink run \
lib/paimon-flink-action-0.9.0.jar \
delete_tag  \
--warehouse file:///data/soft/paimon/catalog \
--database default \
--table t_tags \
--tag_name first_tag-- 回滚到指定tag版本,还原当时的数据
bin/flink run \
lib/paimon-flink-action-0.9.0.jar \
rollback_to \
--warehouse file:///data/soft/paimon/catalog \
--database default \
--table t_tags \
--version first_tag

使用TAG

CREATE TABLE t_tags (age BIGINT,money BIGINT,id STRING,PRIMARY KEY (id) NOT ENFORCED
);
insert into t_tags values(10,1000,'1');-- 创建第一个tag
bin/flink run \
lib/paimon-flink-action-0.9.0.jar \
create_tag \
--warehouse file:///data/soft/paimon/catalog \
--database default \
--table t_tags \
--tag_name first_taginsert into t_tags values(20,2000,'2');bin/flink run \
lib/paimon-flink-action-0.9.0.jar \
create_tag \
--warehouse file:///data/soft/paimon/catalog \
--database default \
--table t_tags \
--tag_name second_tagselect * from t_tags$tags;
Flink SQL> select * from t_tags$tags;
+------------+-------------+-----------+-------------------------+--------------+-------------+---------------+
|   tag_name | snapshot_id | schema_id |             commit_time | record_count | create_time | time_retained |
+------------+-------------+-----------+-------------------------+--------------+-------------+---------------+
|  first_tag |           1 |         0 | 2024-12-19 15:05:18.802 |            1 |      <NULL> |        <NULL> |
| second_tag |           2 |         0 | 2024-12-19 15:08:14.165 |            2 |      <NULL> |        <NULL> |
+------------+-------------+-----------+-------------------------+--------------+-------------+---------------+Flink SQL> select * from t_tags;
+-----+-------+----+
| age | money | id |
+-----+-------+----+
|  10 |  1000 |  1 |
|  20 |  2000 |  2 |
+-----+-------+----+Flink SQL> select * from t_tags/*+ OPTIONS('scan.tag-name' = 'first_tag') */;
+-----+-------+----+
| age | money | id |
+-----+-------+----+
|  10 |  1000 |  1 |
+-----+-------+----+
1 row in set-- 修改tag中数据
insert into t_tags_auto values(20,1000,'1');Flink SQL> select * from t_tags;
+-----+-------+----+
| age | money | id |
+-----+-------+----+
|  20 |  1000 |  1 |
|  20 |  2000 |  2 |
+-----+-------+----+
2 rows in set-- 查询tag,发现没有影响
Flink SQL> select * from t_tags/*+ OPTIONS('scan.tag-name' = 'first_tag') */;
+-----+-------+----+
| age | money | id |
+-----+-------+----+
|  10 |  1000 |  1 |
+-----+-------+----+
1 row in set

自动创建TAG

-- Flink SQL
CREATE TABLE t (k INT PRIMARY KEY NOT ENFORCED,f0 INT,...
) WITH ('tag.automatic-creation' = 'process-time',  -- 时间模式 watermark/batch'tag.creation-period' = 'daily', -- 循环周期 hourly/two-hour'tag.creation-delay' = '10 m', -- 延迟触发时间'tag.num-retained-max' = '90' -- tag保存90个,超出自动删除
);
http://www.lryc.cn/news/507175.html

相关文章:

  • 3分钟读懂数据分析的流程是什么
  • uniapp入门 01创建项目模版
  • React 19新特性探索:提升性能与开发者体验
  • Hive是什么,Hive介绍
  • [LeetCode-Python版] 定长滑动窗口1(1456 / 643 / 1343 / 2090 / 2379)
  • imx6ull qt多页面控制系统(正点原子imx系列驱动开发)
  • OCR:文字识别
  • SQL Server通过存储过程实现自定义邮件格式并定时发送
  • 【进阶编程】MVC和MVVM实现前后端分离的实现
  • HT81297 18W内置升压单声道D类音频功放
  • linux ipmitool配置机器的BMC(服务器管理后台)
  • 【项目实战】location.href 实现文件下载
  • 【Threejs】从零开始(十)--加载gltf模型和压缩后的模型
  • 国标GB28181平台EasyGBS在安防视频监控中的信号传输(电源/视频/音频)特性及差异
  • Day9 神经网络的偏导数基础
  • day4:tomcat—maven-jdk
  • apache-tomcat-6.0.44.exe Win10
  • Redis(2)常用命令
  • 【原生js案例】ajax的简易封装实现后端数据交互
  • 安卓环境配置及打开新项目教程,2024年12月20日最新版
  • Docker 安装 禅道-21.2版本-外部数据库模式
  • 写SQL太麻烦?免费搭建 Text2SQL 应用,智能写 SQL | OceanBase AI 实践
  • 数据分析实战—鸢尾花数据分类
  • 【专题】2024抖音电商母婴行业分析报告汇总PDF洞察(附原数据表)
  • 堆栈粉碎的原理与预防攻击措施
  • Flutter组件————AppBar
  • 请问深度学习直接缝了别的模型,在论文中这种创新点应该如何描述呢?
  • 微流控专题 | 微流体应用说明——藻酸盐微球生产简介
  • 【前后端】HTTP网络传输协议
  • Fastdfs V6.12.1集群部署(arm/x86均可用)