当前位置: 首页 > news >正文

【Hive】——数据仓库

1.1 数仓概念

数据仓库(data warehouse):是一个用于存储,分析,报告的数据系统
目的:是构建面向分析的集成化数据环境,分析结果为企业提供决策支持
特点:
数据仓库本身不产生任何数据,其数据来源于不同外部系统
数据仓库也不需要消费任何的书,其结果开放给各个外部应用使用
这也是为什么叫仓库,而不叫工厂的原因
在这里插入图片描述

1.2 案例

在这里插入图片描述

1.3 数仓特征

在这里插入图片描述

1.3.1 面向主题性

在这里插入图片描述

1.3.2 集成性

在这里插入图片描述

1.3.3 非易性、非异变性

在这里插入图片描述

1.3.4 时变性

在这里插入图片描述

1.4 OLTP、OLAP

1.4.1 OLTP:联机事务处理

在这里插入图片描述

1.4.2 OLAP:联机分析处理

在这里插入图片描述
在这里插入图片描述

1.4.3 OLAP对比OLTP

在这里插入图片描述

在这里插入图片描述

1.5 数据仓库、数据库的区别

在这里插入图片描述
在这里插入图片描述

1.6 数据仓库、数据集市的区别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.7 数据仓库思想与架构

1.7.1 分层思想和标准

操作型数据层(ODS)
数据仓库层(DW)
数据应用层(DA)
在这里插入图片描述

1.7.2 ODS层(Operation Data Store)

在这里插入图片描述

1.7.2 DW层(Data Warehouse)

在这里插入图片描述

1.7.3 DA层(或ADS层)

在这里插入图片描述

1.8 分层作用

在这里插入图片描述
在这里插入图片描述

1.9 ETL、ELT

ETL:抽取Extra、转化Transfer、装载Load
具体顺序基于业务实际灵活选择

1.9.1 ETL

在这里插入图片描述
在这里插入图片描述

1.9.2 ELT

在这里插入图片描述

在这里插入图片描述

http://www.lryc.cn/news/256938.html

相关文章:

  • 算法基础九
  • QT-在ui界面中给QWidget增加Layout布局的两种方法
  • 免费的网页数据抓取工具有哪些?【2024附下载链接】
  • 报错:Parsed mapper file: ‘file mapper.xml 导致无法启动
  • Linux驱动开发学习笔记2《LED驱动开发试验》
  • hive数据库查看参数/hive查看当前环境配置
  • ajax中get和post的区别,datatype返回的数据类型有哪些?web开发中数据提交的几种方式,有什么区别。百度使用哪种方式?
  • STM32用flash保存参数实现平衡擦写的一种方法
  • Aho Corasick Algorithm
  • 用户管理 --汇总
  • Flutter视频播放器在iOS端和Android端都能实现全屏播放
  • 面试遇到的一些问题(二)
  • JDK8新特性:Lambda表达式规则及用法,方法引用
  • 【GIS】JDK版本升级到17后,GeoServer的图层无法通过openLayer预览
  • vue 批量下载文件,不走后端接口的方法
  • 科技云报道:AI+PaaS,中国云计算市场迎来新“变量”?
  • Windows Service Name重复问题
  • BBS项目
  • Java基础——对象类型转换(向上、向下转型)
  • 期末速成数据库极简版【查询】(2)
  • 2023年终总结-轻舟已过万重山
  • 手机号,邮箱,密码,验证码正则表达式[Java]
  • 普冉(PUYA)单片机开发笔记(7): ADC-轮询式多路采样
  • uniapp切换页面时报错问题
  • Nginx 简单入门操作
  • ChatGPT是科学还是艺术?
  • 线程及实现方式
  • 2023年11月10日 Go生态洞察:十四年Go的成长之路
  • OpenSSL 编程指南
  • js优化技巧