当前位置: 首页 > news >正文

【数据仓库-零】数据仓库知识体系 ing

文章目录

  • 一. 数仓基本概念
  • 二. 离线数仓建设方法论
  • 三. etl流程
  • 四. 数仓规范建设指南
  • 四. 数据仓库架构
  • 五. 数据可视化

通过熟悉构建数仓整体的过程,可以系统的了解

  • 数仓构建理论:能够站在全局角度看数仓的运行架构,数仓执行流程。
  • 了解到构建数仓的每一步对应使用哪些技术;

总之学习数仓为我们提供了构建、管理和优化大数据架构的关键技能和知识。

接下来我们了解下数据仓库都有哪些知识点需要我们进行学习:

一. 数仓基本概念

  • 数据仓库基础概念:
    数据仓库概念、
  • 数据仓库架构:有如下架构:
    1.数据集市、2.immon企业工厂架构、3. Kimball数据仓库架构、4.混合型数据架构
  • 数据仓库常见术语解析:维度模型和事实表

 

二. 离线数仓建设方法论

  1. 数仓分层方法
  2. 数仓建模方法:有如下三种方法:
    –(三)范式法
    – 维度建模法
    – 实体建模法
  3. 维度建模详解

维度建模和星型雪花模型的原则

 

三. etl流程

  1. 了解数据抽取、转换和加载的概念
  2. ETL工具都有哪些:flink、hive等
  3. 如何进行数据清洗、转换和汇总

 

四. 数仓规范建设指南

  1. 数仓公共开发规范,见如下开发规范
    – 层次调用规范
    – 数据类型规范
    – 数据冗余规范
    – NULL字段处理规范
    – 指标口径规范
    – 数据表处理规范
    – 表的生命周期管理
  2. 数仓各层开发规范,见如下规范
    – ODS层设计规范
    – 公共维度层设计规范
    – DWD明细层设计规范
    – DWS公共汇总层设计规范
  3. 数仓命名规范:词根设计规范

四. 数据仓库架构

数据仓库典型架构
数据仓库与数据湖、数据集市等概念的关系和区别。

 

五. 数据可视化

常见的数据可视化工具
如何设计仪表板和报表

 

http://www.lryc.cn/news/205044.html

相关文章:

  • css3 3D 转换 技巧详细解析与代码实例
  • [Unity]给场景中的3D字体TextMesh增加描边方案一
  • TDengine(taos)数据库导出历史数据
  • 算法进修Day-37
  • 服务器之日常整活
  • 交互式 Web 应用 0 基础入门
  • JSONP的安全性较差,那么在跨域情况下,有没有其他更安全的替代方案呢?
  • Slax Linux 获得增强的会话管理和启动参数选项
  • C/C++新冠疫情死亡率 2020年9月电子学会青少年软件编程(C/C++)等级考试一级真题答案解析
  • Adobe Photoshop 基本操作
  • SpringMVC原理及核心组件
  • 【rk3568-linux】 rk3568x_linux-- 编译说明
  • 模拟计算器编程教程,中文编程开发语言工具编程实例
  • Spring Security漏洞防护—HTTP 安全响应头
  • Plooks大型视频在线一起看网站源码
  • 图像处理中底层、高层特征、上下文信息理解
  • 负载均衡的算法(静态算法与动态算法)
  • mac安装jdk
  • WIN11+OPENCV4.8 编译及下载失败处理方法
  • 万宾科技智能井盖传感器怎么使用?
  • Server Name Indication(SNI),HTTP/TLS握手过程解析
  • react项目实现文件预览,比如PDF、txt、word、Excel、ppt等常见文件(腾讯云cos)
  • ES SearchAPI----Query DSL语言
  • 【STM32】HAL库——串口中断只接收到两个字符
  • 页面html结构导出为word或pdf
  • Object.prototype.toString.call() 和 instanceOf 和 Array.isArray() 详解
  • 自学(黑客技术)方法——网络安全
  • CVE-2023-46227 Apache inlong JDBC URL反序列化漏洞
  • MySQL几种方法的数据库备份
  • CI/CD:GitLab-CI 自动化集成/部署 JAVA微服务的应用合集