当前位置: 首页 > news >正文

企业如何实现数据从源端到消费端的全链路加工逻辑可视化?

要想实现数据加工链路的可视化,血缘图谱无疑是一个有效的工具。血缘图谱能够清晰地展示数据从产生、流转、加工到最终消费的每一个环节,帮助企业直观地理解数据之间的关联和依赖关系,轻松追溯数据来源和去向,并在数据出现问题时快速定位并解决,从而大幅提升数据管理的质量和效率。

但是当我们提到血缘图谱,很多时候说的都是“表级血缘”,即关注表与表之间的依赖关系。由于这种关系往往存在高度泛化性,所以在进行下探或者上溯多层后,扩散出百倍甚至千倍的上下游,使用难度极大。举例来说,当表级血缘下探 3 层后,可能会搜索出超过数千的下游表,导致企业在需要执行精细化的影响分析时,不得不深入到代码层面,逐一审查逻辑,并理解为何某张表的变化会影响另一张表,这种低效的分析方式让表级血缘聊胜于无。

除了“表级血缘”外,还有另外一种主流的血缘图谱工具,就是以开源的 Atlas 为代表的“列级血缘”。这种工具尝试通过关系推断和正则匹配方式构建上下游字段之间的依赖关系,然而由于技术解析的复杂性和局限性,列级血缘的解析准确率不可靠。根据抽检统计,多数列级血缘解析准确率低于 80%。

所以,想要实现企业数据全链路端到端的加工逻辑看得一清二楚,我们还需要进一步将血缘解析精确到算子级,并且保证解析准确率极高方可。意识到企业的这一需求,国内 Data Fabric 架构理念实践者与引领者 Aloudata,自主研发了算子级血缘技术,能够深入剖析复杂的代码计算逻辑,准确、精细地刻画初字段间的精细加工关系,为企业交付高精准的算子级血缘图谱。

算子级血缘图谱,以可视化的方式展示资产与资产之间的元数据血缘图谱,企业只需要简单的点选操作,无需通过脚本代码逐一分析,轻松理解资产直接血缘和间接血缘,直观获取字段直接加工口径和完整加工逻辑,并且便捷实现多层级数据血缘按条件快速展开和口径合并分析,分析响应从天级提升至分钟级。

在这个基础上,Aloudata 打造了全球首个算子级血缘主动元数据平台——Aloudata BIG,其具备强大的多源采集解析能力,成功支持了市场上主流的数据库的血缘解析,包括 Hive、Gauss、Oracle、MySQL 、PostgreSQL、Greeplum、Analytic Database 等,支持 Presto、Spark、Impala 等计算平台的血缘解析,支持 Oracle、DB2 等 PLSQL 存储过程血缘解析。

此外,Aloudata BIG 支持配置式、扩展式的采集器结构,可以在算子级血缘图谱中快速接入企业自定义资产,助力企业形成数据资产“一张图” ,全面整合和分析公司所有数据资产元数据。通过将技术元数据、管理元数据、业务元数据与算子级血缘图谱紧密绑定,Aloudata BIG 平台能够帮助企业实现从数据源到应用端的全连通能力,为数据管理场景提供端到端的自动化解决方案。

在 Aloudata BIG 平台的支持下,招商银行构建起全链路算子级血缘图谱,将算子级血缘分析技术应用到模型优化和变更协同的场景中,服务全行的数据开发人员,血源解析成功率提升至 99.9%,全链路协同保障效率提升 10 倍,平均数据链路缩短 50%。访问 Aloudata 官网,了解更多。

http://www.lryc.cn/news/502059.html

相关文章:

  • Toxicity of the Commons: Curating Open-Source Pre-Training Data
  • Python 单例模式工厂模式和classmethod装饰器
  • 计算机键盘简史 | 键盘按键功能和指法
  • 【数字信号处理】期末综合实验,离散时间信号与系统的时域分析,离散信号 Z 变换,IIR 滤波器的设计与信号滤波,用窗函数法设计 FIR 数字滤波器
  • 面试技术点之安卓篇
  • Windows Terminal ssh到linux
  • 自适应卡尔曼滤波(包括EKF、UKF、CKF等)的创新思路——该调什么、不该调什么
  • SpringBoot项目监听端口接受数据(NIO版)
  • QT实战--带行号的支持高亮的编辑器实现(2)
  • (翻译)网络安全书籍推荐列表
  • TcpServer 服务器优化之后,加了多线程,对心跳包进行优化
  • 黑马程序员Java项目实战《苍穹外卖》Day12
  • 经纬度解析到省市区【开源】
  • bug:uniapp运行到微信开发者工具 白屏 页面空白
  • 旧版本 MySQL 处理字符表情写入问题
  • vue使用v-if和:class完成条件渲染
  • Docker:WARNING: Published ports are discarded when using host network mode 解决方法
  • 音视频入门基础:MPEG2-TS专题(12)—— FFmpeg源码中,把各个transport packet组合成一个Section的实现
  • 【数据结构】二叉树的性质和存储结构
  • gbase8s之查看锁表的sql
  • URI 未注册(设置 语言和框架 架构和 DTD)
  • Ubuntu上使用system()函数运行不需要输入密码
  • 【MySQL】数据库必备知识:全面整合表的约束与深度解析
  • Windows下Docker快速安装使用教程
  • PTA DS 6-2 另类堆栈 (C补全函数)
  • rk3568之mpp开发笔记mpp移植到开发板
  • Vue解决跨域问题
  • Kubernetes Nginx-Ingress | 禁用HSTS/禁止重定向到https
  • TortoiseGit的下载、安装和配置
  • 如何绕过IP禁令