当前位置: 首页 > news >正文

元数据管理

1、业务元数据

  1. 描述 ”数据”背后的业务含义
  2. 主题定义:每段 ETL、表背后的归属业务主题。
  3. 业务描述:每段代码实现的具体业务逻辑。
  4. 标准指标:类似于 BI 中的语义层、数仓中的一致性事实;将分析中的指标进行规范化。
  5. 标准维度:同标准指标,对分析的各维度定义实现规范化、标准化。
  6. 不断的进行维护且与业务方进行沟通确认。

2、技术元数据

  • 数据源元数据
    • 例如:数据源的 IP、端口、数据库类型;数据获取的方式;数据存储的结构;原数据各列的定义及 key 指对应的值。

  • ETL 元数据
    • 根据 ETL 目的的不同,可以分为两类:数据清洗元数据数据处理元数据
    • 数据清洗,主要目的是为了解决掉脏数据及规范数据格式;因此此处元数据主要为:各表各列的"正确"数据规则;默认数据类型的"正确"规则。
    • 数据处理,例如常见的表输入表输出;非结构化数据结构化;特殊字段的拆分等。源数据到数仓、数据集市层的各类规则。比如内容、清理、数据刷新规则。

  • 数据仓库元数据
    • 数据仓库结构的描述,包括仓库模式、视图、维、层次结构及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式等。

  • BI 元数据
    • 汇总用的算法、包括各类度量和维度定义算法。数据粒度、主题领域、聚集、汇总、预定义的查询与报告。

3、管理元数据

管理领域相关,包括管理流程、人员组织、角色职责等。

4、小编有话

在日常工作中,元数据的管理主要体现在元数据的采集、存储、查询、应用几个方面。原则上应从规范化,到脚本化,到工具化的方向进行建设。

  • 采集:元数据采集时尽可能详细,真实,可通过工具生成或者勾选,避免手动录入带来不规范等问题
  • 存储:存储元数据要做到不失真,元数据变更时及时同步
  • 查询:通过网页或库表等方式,方便快捷的看到元数据,辅助进行开发
  • 应用:数据血缘、优化调度依赖、数据治理等
http://www.lryc.cn/news/62962.html

相关文章:

  • C# WebService的开发以及客户端调用
  • 有符号数和无符号数左移和右移
  • Netty小白入门教程
  • 【逻辑位移和算数位移】
  • Blender3.5 边的操作
  • Java与Python、Node.js在人工智能和区块链应用程序开发中的比较
  • 【计算机是怎么跑起来的】基础:计算机三大原则
  • NXP公司LPC21XX+PID实现稳定温度控制
  • 【CE实战-生化危机4重置版】实现角色瞬移、飞翔
  • 强烈建议互联网人转战实体和农业,去了就是降维打击!实体太缺人才了,老板也不缺钱!...
  • 如何将 github pages 迁移到 vercel 上托管
  • 2023五一数学建模竞赛(五一赛)选题建议
  • Packet Tracer - 配置 RIPv2
  • Android类似微信聊天页面教程(Kotlin)四——数据本地化
  • C/C++基础知识
  • Java 入门 - 语法基础
  • Java线程池及拒绝策略详解
  • GitLABJenkins
  • 互联网摸鱼日报(2023-04-26)
  • 石化企业数字化防爆融合通信解决方案
  • NTT学习笔记(快速数论变换)
  • Android类似微信首页的页面开发教程(Kotlin)二
  • PAt A1015 Reversible Primes
  • 解决Lemuroid识别不到蓝牙键盘的问题
  • SpringBoot 使用 Sa-Token 完成权限认证
  • Spring核心与设计思想、创建与使用
  • mysql 备份 还原
  • 每日学术速递4.26
  • RabbitMQ使用StringRedisTemplate-防止重复消费
  • 临沂大学张继群寄语