当前位置: 首页 > news >正文

26-数据仓库与Apache Hive

1.数据仓库 是什么?解决什么?

 1.1 数据仓库Data Warehouse 数仓 / DW 是一个用于存储、分析、报告的数据系统.目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。数仓专注于分析数仓本身不“”生产“”数据,其数据来源于不同的外部系统;数仓本身不“”消费“”任何数据,其结果开放给各个外部应用使用;基于业务数据开展数据分析,基于分析结果为决策提供支撑!数据驱动决策的制定!!!!在哪里分析?数据库可以吗?可以,但是没必要https://baike.baidu.com/item/OLTP/5019563 

数仓出现了!
在这里插入图片描述
在这里插入图片描述

2.数据仓库的特点

	2.1 面向主题数据综合 归类 2.2 集成性数据分布在不同的系统中,彼此独立、分散进行数据综合和计算 2.3 非易失性是数据分析的平台,而不是数据创造的平台 查询较多,修改删除很少2.4 时变性历史数据 2019 2021 数据仓库的数据要随着时间进行更新,以适应决策的需要。数据仓库的建设是一个项目,更是一个过程。

3. 理解SQL编程的概念、优点

http://www.lryc.cn/news/611021.html

相关文章:

  • centos通过DockerCompose搭建开源MediaCMS
  • Coze Studio开源,企业用户多了一种选择,也需多几分考量
  • MySQL 中 VARCHAR 和 TEXT 的区别
  • 区分邮科工业交换机与路由器
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘pytorch-lightning’问题
  • 【图像算法 - 09】基于深度学习的烟雾检测:从算法原理到工程实现,完整实战指南
  • Google AI 发布 MLE-STAR:一款能够自动执行各种 AI 任务的先进机器学习工程代理
  • 《算法导论》第 3 章 - 函数的增长
  • UE5.5使用ControlRig实现MetaHumanNPC看向玩家
  • oelove奥壹新版v11.7旗舰版婚恋系统微信原生小程序源码上架容易遇到的几个坑,避免遗漏参数白屏显示等问题
  • 【开源工具】基于Python的PDF清晰度增强工具全解析(附完整源码)
  • bluetooth matlab GFSK 调制解调,误码率统计
  • eclipse类IDE导入现有工程教程
  • 主数据变更流程
  • 文件夹的类型:文件夹 (.0)是什么意思?
  • 三极管三种基本放大电路:共射、共集、共基放大电路
  • 深入浅出 RabbitMQ-路由模式详解
  • SpringBoot中策略模式使用
  • 如何通过 5 种方式将照片从 iPad 传输到电脑
  • qt窗口--01
  • 【数据结构入门】数组和链表的OJ题(2)
  • LeetCood算法题~水果成篮
  • 美化一下达梦grant授权说明
  • 使用vscode编写markdown文档(使用Markdown Preview Enhanced和markdownlint两个插件)以及若干配置
  • vscode 关闭自动更新
  • 英语中日期与时间缩写
  • 计算机网络:目的网络在路由表项中的作用
  • RabbitMQ削峰填谷详解:让系统在流量洪峰中“稳如泰山”
  • Rust进阶-part4-智能指针2
  • linux查看kafka的消费组里是否有积压