当前位置: 首页 > news >正文

数据仓库与ETL

什么是数据仓库

一种用于存储和管理数据的系统,提供一种统一方式,将不同来源、不同方式、不同时间的数据集成在一起。

数据仓库结构

主题域:一个特定领域的数据集,比如营销、销售、客户、库存等。
维度:定义数据的不同角度,时间、地点等。
事实表:存储实际数据,销售额、库存量等。

四个特点:

面向主题:数据仓库面向企业或组织主要的主题,不同于传统的数据库系统,数据仓库将企业不同的业务系统、数据来源整合到一起,使得用户可以集中处理特定主题的问题。

集成的:数据仓库与企业内部或外部的多个源系统整合,把这些单个的数据源整合到一起形成一张完整的数据库,使得企业数据变得完整、方便分析。

非易失的(稳定的、不可更新):数据仓库中的数据被认为是“非易失的”即一旦存储在仓库中就不会丢失。数据仓库需要保留历史数据以便分析,同时为了保证数据持久性,数据仓库采用了数据备份和恢复机制。

面向分析(反映历史变化、时间特性):数据仓库主要用于支持企业的决策分析过程。数据仓库的数据表结构、字段、视图等信息都是被设计为方便用户进行数据分析、交互、制图和报表的。同时,数据仓库采用了 OLAP 技术,使得用户可以进行复杂的多维数据分析,以及在线分析处理等操作。

主机不变

ETL过程

抽取数据:不同数据源抽取数据
转换:清洗、格式化、转换
加载:加载到数据仓库、分析和报表操作
全量加载
增量加载

http://www.lryc.cn/news/194705.html

相关文章:

  • Centos7安装Gitlab--gitlab--ee版
  • 主题教育问题清单及整改措施2023年-主题教育对照六个方面个人剖析材料
  • php新手实战:自定义书源下载api
  • 数据结构 - 5(二叉树7000字详解)
  • xshell使用方法(超详细)
  • 【数据库系统概论】第三章关系数据库标准语言SQL
  • 云计算是什么?学习云计算能做什么工作?
  • ES6 -- 模块化(CommonJS、AMD、ES Module)
  • c# xml 参数读取读取的简单使用
  • gym原来是这样用的
  • 百度SEO优化技巧与布局(提升网站排名的5种有效方法)
  • 文案配音软件哪个好?(适合新手使用)
  • excel映射xml方法
  • 2023/10/15
  • Linux系统中如何开启和配置OpenGauss数据库的远程连接
  • 【Docker】Docker网络及容器间通信详解
  • TikTok国际版 使用特网科技Bluestacks模拟器安装方法
  • 【Hello Algorithm】暴力递归到动态规划(四)
  • arm day 8
  • k8s-14 存储之volumes
  • 二分图博弈
  • 【C++】C++11—— 包装器
  • LED显示屏高刷新率和低刷新率有什么区别
  • 国际伦敦银点差费值得吗?
  • 常见的作物模型应用技巧!DSSAT模型、APSIM模型、WOFOST模型与PCSE模型等应用
  • 2023年中国超硬材料制品分析及超硬刀具市场规模分析[图]
  • 使用React、Express实现一个问卷发布/收集系统
  • DDD之上下文映射图(Context Mapping)
  • CountDownLatch的原理
  • Java新特性Stream流详解