当前位置: 首页 > news >正文

数仓之全量表、增量表、快照表、切片表、拉链表的基本概念

文章摘自:数仓之全量表、增量表、快照表、切片表、拉链表-腾讯云开发者社区-腾讯云

一、全量表

记录每天所有最新状态的数据,有无变化都要上报,每次往全量表里面写数据都会覆盖之前的数据

缺点:不能记录数据的历史变化,只能截止到当前最新、全量的数据

二、增量表

记录每天的新增数据和改变的数据

三、快照表

按日分区,记录截止数据日期的全量数据(每个分区都是记录截止当前分区日期的全量数据)

优点:可以反应历史的变化

缺点:在数据量打的情况下,每个分区存储的都是全量数据,数据冗余和浪费存储空间。

四、切片表

切片表根据基础表,往往只反映某一个维度的相应数据。其表结构与基础表结构相同,但数据往往只有某一维度,或者某一个事实条件的数据。

五、拉链表

记录一个事务从开始,一直到当前状态的所有变化的信息(极限存储)

优先:能够解决快照表数据冗余问题,还能维护数据历史状态和最新状态,记录截止数据日期的全量数据。

http://www.lryc.cn/news/479219.html

相关文章:

  • 【富集分析GSEA】如何理解富集分析以及应用
  • 一七五、HTML 不同类型的事件及其说明和示例
  • 数量少的连锁店要不要用智能巡检?
  • 【CSS】外边距塌陷
  • WPF MVVM入门系列教程(二、依赖属性)
  • Springboot集成syslog+logstash收集日志到ES
  • Devops业务价值流:软件研发最佳实践
  • Matplotlib 绘图艺术:从新手到高手的全面指南
  • [ shell 脚本实战篇 ] 编写恶意程序实现需求(恶意程序A监测特定目录B出现特定文件C执行恶意操作D-windows)
  • SQLI LABS | Less-33 GET-Bypass AddSlashes()
  • 界面控件DevExpress WPF中文教程:Data Grid——卡片视图设置
  • flink 内存配置(一):设置Flink进程内存
  • 贪心算法习题其三【力扣】【算法学习day.20】
  • 速盾:高防cdn针对网站的好处有哪些?
  • 【Java SE语法】抽象类(abstract class)和接口(interface)有什么异同?
  • 京准同步:GPS北斗卫星授时服务器发展趋势介绍
  • 鸿蒙多线程开发——并发模型对比(Actor与内存共享)
  • 【计算机网络】章节 知识点总结
  • 开箱即用!265种windows渗透工具合集--灵兔宝盒
  • 怎么在哔哩哔哩保存完整视频
  • CPU算法分析LiteAIServer视频智能分析平台视频智能分析:抖动、过亮与过暗检测技术
  • fastGPT调用stable diffusion生成图片,本地模型使用ollama
  • 【jmeter】jmeter的线程组功能的详细介绍
  • 高边坡安全监测系统的工作原理和应用领域
  • Java:多态的调用
  • A day a tweet(seventeen)——Visualize Convolution Neural Network!
  • 卡达掐发展史
  • UI界面设计入门:打造卓越用户体验
  • 【Linux:tcp三次握手和四次挥手】
  • 大数据Informatica面试题及参考答案