当前位置: 首页 > news >正文

数据仓库简介(一)

数据仓库概述

1. 什么是数据仓库?

数据仓库(Data Warehouse,简称 DW)是由 Bill Inmon 于 1990 年提出的一种用于数据分析和挖掘的系统。它的主要目标是通过分析和挖掘数据,为不同层级的决策提供支持,构成商业智能(BI)的一部分。

在这里插入图片描述

1.1 数据仓库的目标

数据仓库的核心目标是:

  • 分析与挖掘数据:提供决策支持。
  • 集中数据存储:从多种来源采集和抽取数据,形成企业数据的全局视图。
  • ETL 技术:通过数据抽取、转换和加载(ETL)技术实现数据的统一集成。

1.2 数据仓库的定义

数据仓库是一个:

  • 面向主题的:专注于特定的业务主题。
  • 集成的:从不同的数据源聚合数据。
  • 相对稳定的:数据在装入后一般不可更新,主要用于查询。
  • 反映历史变化的:保存历史数据,支持管理决策。

在这里插入图片描述

4. 数据仓库的特点

面向主题

数据仓库专注于特定业务领域,仅保留与该主题相关的数据,排除无关细节。

随时间变化

数据仓库能够保存历史数据,支持基于时间变化的分析,通常使用拉链表的方式在保证访问历史快照的同时降低存储空间。

集成的

通过 ETL 操作,将来自不同来源的数据集成到统一的数据仓库中。

数据不可更新

数据仓库的数据在加载后主要进行查询操作,不支持传统数据库的增删改操作,反映的是长时间范围内的历史数据。

5. 数据仓库与关系型数据库区别

特性数据仓库 /Hive关系型数据库/Mysql,Oracle
数据范围历史的/完整的/反映历史变化的数据当前在线交易状态数据
数据变化可添加/无删除/无更新/反应历史变化支持频繁的增删改查
应用场景BI、支持战略决策面向业务交易/事务流程
设计理论面向主题设计、违背范式、适当冗余面向事务设计、遵循范式、避免冗余
处理特点非频繁/大批量/高吞吐/有延迟频繁/小批次/高并发/低延迟
服务对象分析数据、服务于决策支持捕获数据、服务于业务操作人员

在这里插入图片描述

http://www.lryc.cn/news/452455.html

相关文章:

  • Kafka和RabbitMQ区别
  • go-zero学习
  • python如何查询函数
  • 计算机视觉与深度学习 | 从激光雷达数据中提取地面点和非地面点(附matlab代码)
  • vulnhub-wakanda 1靶机
  • Bilibili视频如何保存到本地
  • C++之多线程
  • 《C++音频降噪秘籍:让声音纯净如初》
  • C(十)for循环 --- 黑神话情景
  • 记录一次docker报错无法访问文件夹,权限错误问题
  • react crash course 2024(8) useEffect
  • GEE开发之Modis_NDWI数据分析和获取
  • netty之NettyClient半包粘包处理、编码解码处理、收发数据方式
  • Linux:文件描述符介绍
  • stm32f103调试,程序与定时器同步设置
  • 《Python编程:从入门到实践》数据可视化
  • github/git密钥配置与使用
  • BiLSTM模型实现电力数据预测
  • VMware ESXi 6.7U3u macOS Unlocker 集成驱动版更新 OEM BIOS 2.7 支持 Windows Server 2025
  • 一个简单的SQL面试题
  • 网站服务器在不同操作系统上监听端口情况的方法
  • RabbitMQ篇(基本介绍)
  • 浅谈网络通信中的透传和非透传
  • 影视cms泛目录用什么程序?苹果cms二次开发泛目录插件
  • IP6537_C_30W20V--移动设备快充的得力助手,集成 14 种快充协议的降压 SoC
  • 【hot100-java】【寻找两个正序数组的中位数】
  • C++七种异常处理
  • 【C语言系统编程】【第三部分:网络编程】3.3 实践与案例分析
  • Unity3D播放GIF图片 插件播放
  • 基于STM32的远程工业控制系统架构设计:MQTT通信、React界面与FreeRTOS优化的综合应用