当前位置: 首页 > news >正文

大数据的数据整合


数据整合是对导入的各类源数据进行整合,新进入的源数据匹配到平台上的标准数据,或者成为系统中新的标准数据。数据整合工具对数据关联关系进行设置。经过整合的源数据实现了基本信息的唯一性,同时又保留了与原始数据的关联性。具体功能包括关键字匹配、自动匹配、新增标准数据和匹配质量校验4个模块。有时,需要对标准数据列表中的重复数据进行合并,在合并时保留一个标准源。对一些拥有上下级关联的数据,对它们的关联关系进行管理设置。
数据质量校验包括数据导入质量校验和数据整合质量校验两个部分,数据导入质量校验的工作过程是通过对原始数据与平台数据从数量一致性、重点字段一致性等方面进行校验,保证数据从源库导入平台前后的一致性;数据整合质量校验的工作是对经过整合匹配后的数据进行质量校验,保证匹配数据的准确性,比如通过SQL 脚本进行完整性校验。
数据整合往往涉及多个整合流程,所以数据平台一般具有BPM 引擎,能够对整合流程进行配置、执行和监控。

http://www.lryc.cn/news/491051.html

相关文章:

  • 回溯法经典难题解析
  • LLM的原理理解6-10:6、前馈步骤7、使用向量运算进行前馈网络的推理8、注意力层和前馈层有不同的功能9、语言模型的训练方式10、GPT-3的惊人性能
  • Electron开发构建工具electron-vite(alex8088)添加VueDevTools(VitePlugin)
  • 【C++】static修饰的“静态成员函数“--静态成员在哪定义?静态成员函数的作用?
  • =computed() =ref()
  • webgl threejs 云渲染(服务器渲染、后端渲染)解决方案
  • 【shell编程】函数、正则表达式、文本处理工具
  • 解决 npm xxx was blocked, reason: xx bad guy, steal env and delete files
  • 如何进行高级红队测试:OpenAI的实践与方法
  • Java:二维数组
  • Android 天气APP(三十七)新版AS编译、更新镜像源、仓库源、修复部分BUG
  • Xilinx IP核(3)XADC IP核
  • 计算机网络socket编程(2)_UDP网络编程实现网络字典
  • c#窗体列表框(combobox)应用——省市区列表选择实例
  • Nginx 架构与设计
  • python Flask指定IP和端口
  • 多线程 相关面试集锦
  • 【数据结构】—— 线索二叉树
  • uni-app 发布媒介功能(自由选择媒介类型的内容) 设计
  • How to update the content of one column in Mysql
  • URL在线编码解码- 加菲工具
  • Python3 爬虫 Scrapy的安装
  • QT中QString类的各种使用
  • linux 网络安全不完全笔记
  • uniapp将图片url转换成base64支持app和h5
  • odoo17 档案管理之翻译2
  • 风尚云网前端学习:制作一款简易的在线计算器
  • Android蓝牙架构,源文件目录/编译方式学习
  • ubuntu中使用ffmpeg和nginx推流rtmp视频
  • strongswan测试流程