26-数据仓库与Apache Hive
1.数据仓库 是什么?解决什么?
1.1 数据仓库Data Warehouse 数仓 / DW 是一个用于存储、分析、报告的数据系统.目的:构建面向分析的集成数据环境,分析结构为企业提供决策支持。数仓专注于分析数仓本身不“”生产“”数据,其数据来源于不同的外部系统;数仓本身不“”消费“”任何数据,其结果开放给各个外部应用使用;基于业务数据开展数据分析,基于分析结果为决策提供支撑!数据驱动决策的制定!!!!在哪里分析?数据库可以吗?可以,但是没必要https://baike.baidu.com/item/OLTP/5019563
数仓出现了!
2.数据仓库的特点
2.1 面向主题数据综合 归类 2.2 集成性数据分布在不同的系统中,彼此独立、分散进行数据综合和计算 2.3 非易失性是数据分析的平台,而不是数据创造的平台 查询较多,修改删除很少2.4 时变性历史数据 2019 2021 数据仓库的数据要随着时间进行更新,以适应决策的需要。数据仓库的建设是一个项目,更是一个过程。