当前位置: 首页 > news >正文

大数据测试中,数据仓库表类型有哪些?

本文我们一起了解一下数据仓库测试的对象,直白一点讲就是一张表,这张表分为以下几种类型:

全量表:没有分区的表,数据全量更新或者增量合并,我们通常理解就是把这些数据放到了一个文件夹里面。这样会有什么好处呢?全量表查询的效率非常高,成本比较低。但是它不能反应数据状态,只保存最新状态的数据。

分区表:有分区的表,比如我们把订单信息放到了几个文件夹去储存,一个文件夹按照天去切分。分区表分为两种,一种是增量的,每天存一份。第二种是全量更新,比如我们可能会把历史之前所有的数据存储在某一天的数据里面。

分区表的好处是可以查询到历史数据的状态以及变化过程,但是可以保存历史数据的状态,一般使用日期或者地区作为分区条件。有一个缺点是在一些时间节点上容易产生数据漂移。

临时表:放在tmp的表,这种表一般是测试或开发临时保存一些数据时用的,一般不需要我们去测试。一般只会保存很短的时间,过了时间系统会自动清掉。

拉链表:是一种维护历史状态,以及最新状态数据的一种表,一般只会插入更新有状态变化的数据,保存数据的历史状态,不变更。这样做的好处就是节省存储资源。

外部表:是建表的时候被external 修饰的表。删除外部表的时候,只会删除元数据,数据本身不删除,外部表可以自己指定路径,跨部门使用比较安全。

后面会带大家继续了解大数据测试,欢迎大家继续关注。

(本系列文章根据《优品软件培育计划》公益直播内容整理,观看直播回放可以私信我获取观看链接。)

http://www.lryc.cn/news/546081.html

相关文章:

  • 基于开源库编写MQTT通讯
  • Kafka Connect连接器的全生命周期:
  • 磁盘空间不足|如何安全清理以释放磁盘空间(开源+节流)
  • DeepSeek vs Grok vs ChatGPT:大模型三强争霸,谁将引领AI未来?
  • 2025国家护网HVV高频面试题总结来了04(题目+回答)
  • 我的AI工具箱Tauri版-通用音频转文本
  • Vue.js计算属性
  • 品佳诚邀您参加 3/12『英飞凌汽车方案引领智能座舱新纪元』在线研讨会
  • 科普|无人机专业术语
  • Tauri跨平台开发问题及解决方案深度解析(React版)
  • 基于单片机和Wifi技术的智能台灯设计
  • ds回答-开源llm应用开发平台
  • 【量化策略】均值回归策略
  • iterm2更新后主题报错
  • 深度学习架构Seq2Seq-添加并理解注意力机制(一)
  • Kafka底层结构
  • [BUUCTF]web--wp(持续更新中)
  • axios请求设置request umijopenai生产前端请求 ts状态全局 v-if v-else 与动态js变量
  • SparkSQL全之RDD、DF、DS ,UDF、架构、资源划分、sql执行计划、调优......
  • 深入理解Linux内存缓存:提升性能的关键
  • STM32-FOC-SDK包含以下关键知识点
  • sql调优:优化响应时间(优化sql) ; 优化吞吐量
  • 【Mybatis】如何简单使用mybatis-plus,以及MybatisGenerator自动生成或者实现SQL语句
  • Halcon 车牌识别-超精细教程
  • LeetCode 25 - K 个一组翻转链表
  • 一文读懂智能硬件定位:开启智能时代的精准导航
  • 夸父工具箱(安卓版) 手机超强工具箱
  • Html5学习教程,从入门到精通,HTML5 列表语法知识点及案例代码(11)
  • 内核进程调度队列(linux的真实调度算法) ─── linux第13课
  • 16.7 LangChain LCEL 极简入门:Prompt + LLM 的黄金组合