当前位置: 首页 > news >正文

数据质量管理概述

1、数据质量的概念

指的是在组织业务,管理要求下,符合数据使用者满足业务,管理需求的评价方式

2、数据质量管理的概念

3、4种常见低质量数据情况

1)重要数据缺失

  • 有些信息暂时无法获取或者获取代价太大
  • 信息在采集输入中遗漏
  • 属性值不存在

2)数据异常

3)数据不一致

4)数据重复或者错误

4、影响数据质量3大因素

1)业务影响

  • 业务需求不清晰
  • 业务数据输入不规范
  • 虚假信息

2)技术影响

  • 数据源质量问题
  • 数据采集过程质量问题
  • 数据传输过程质量问题
  • 数据装载过程质量问题
  • 数据存储问题

3)管理影响

  • 对数据质量问题不够重视
  • 没有数据治理组织,缺乏数据追责机制
  • 缺乏数据规划
  • 数据输入规范不统一
  • 缺乏有效的数据监控机制

5、数据质量评判6大维度

  • 完整性
  • 一致性
  • 准确性
  • 时效性
  • 合规性
  • 可访问性

6、数据质量管理实施6部曲

1)确定目标和范围

2)数据质量调研

  • 调研企业系统质量情况
  • 分析数据质量问题
  • 制定数据质量提升范围

3)设定数据质量管理角色、流程和制度

4)数据质量规则制定

  • 已有的数据标准
  • 监管要求,行业规范
  • 调研的数据质量问题
  • 业务需求

5)数据质量平台建设

6)数据质量运营持续提升

http://www.lryc.cn/news/58469.html

相关文章:

  • C++ const、volatile和mutable关键字详解
  • MySQL实验四:数据更新
  • 商汤科技推出“日日新SenseNova”,大模型体系赋能人工智能新未来
  • 【中创AI】斯坦福人工智能年度报告:AI论文发表量中国世界第一!
  • Java基础(五)面向对象编程(基础)
  • 寻找CSDN平行世界的另一个你
  • ChatGPT的发展对客户支持能提供什么帮助?
  • 数据安全评估体系建设
  • 论文阅读 - ANEMONE: Graph Anomaly Detection with Multi-Scale Contrastive Learning
  • 数据密集型应用存储与检索设计
  • Spring Boot集成Redis实现keyspace监听 | Spring Cloud 34
  • 如何搭建chatGPT4.0模型-国内如何用chatGPT4.0
  • 【故障定位】基于多元宇宙算法的主动配电网故障定位方法研究(Matlab代码实现)
  • 基于html+css的自适应展示1
  • DolphinDB +Python Airflow 高效实现数据清洗
  • pip3 升级软件包时遇到超时错误解决方法
  • Linux环境开机自启动
  • 字节8年测试经验,送给想要学习自动化测试的同学6条建议
  • 快速搭建springboot websocket客户端
  • Python 操作 MongoDB 详解
  • 虹科案例 | 丝芙兰xDomo:全球美妆巨头商业智能新玩法
  • 10种优雅的MyBatis写法,同事用了都说好
  • SQL删除记录方式汇总
  • 用in函数嵌入子查询作为条件时查出结果为空
  • 电商行业如何利用飞项解决跨部门协作难题
  • 全网最详细,Jmeter性能测试-性能基础详解,参数化函数取值(二)
  • 选择排序的简单理解
  • 使用js封装一个循环链表
  • NumPy 秘籍中文第二版:二、高级索引和数组概念
  • 新品-图灵超频工作站GT430M介绍