当前位置: 首页 > news >正文

新一代数据质量平台datavines

在我实习的第一家公司的时候,有幸参与Apache Griffin的开发,也先后在一起其他公司使用过数据质量平台,同时也调研过一些开源的数据质量平台。

最近和朋友一起参与开发了datavines数据质量平台,随着在数据行业越呆越久,我想再聊一聊数据质量,以及 我眼中的开源项目 datavines。

Griffin

优点:开源早,有一些成熟的公司借鉴和使用,核心领域主要在数据质量监控

缺点:部署依赖非常多,ElasticSearch、Hadoop、Livy、Spark等,离线处理主要依赖spark、实时处理主要以将流转成微批,采用Spark Streaming为主,技术栈 java、scala 前端 angular。横向可扩展功能较差、作业容错处理较差。

datavines

优点:核心功能包括:数据质量监控、数据探查、数据对比,功能明细优于 Griffin;部署依赖非常简单,只需要依赖 Mysql 就可以完成任务的调度。支持数据源丰富,横向扩展能力强、支持作业容错处理。

缺点:开源较迟,具有前景
 

Qualitis

优点:微众开源的数据质量平台(因为调研使用不多,所以不展开描述)

缺点:底层执行引擎依赖Linkis

http://www.lryc.cn/news/216576.html

相关文章:

  • 建议收藏《2023华为海思实习笔试-数字芯片真题+解析》(附下载)
  • 【详细教程】关于如何使用GitGitHub的基本操作汇总GitHub的密钥配置 ->(个人学习记录笔记)
  • HTML样式CSS、图像
  • 智能电表瞬时电量是什么意思?
  • Redis之 redis.config配置文件
  • BIOS开发笔记 - CMOS
  • leetcode_117 填充每个节点的下一个右侧节点指针 II
  • 亲测 IDEA Pycharm 全家桶 自动重置免费30天
  • Marp: 将 Markdown 变为 PPT 式样的 VScode 插件
  • 根据正则表达式截取字串符,这个办法打败99%程序员
  • 冬天女儿的羽绒服就选它了,哈哈很喜欢
  • Vim插件配置
  • 函数参数的最佳传递方式与现代C++的规则
  • Asterisk Ubuntu 安装
  • rwkv模型lora微调之accelerate和deepspeed训练加速
  • 分享一下在微信小程序里怎么做一个投票链接
  • v-model语法糖
  • 纷享销客荣获最佳制造业数字营销服务商奖
  • 蓝桥杯每日一题2023.11.3
  • 中国电子云-隐私计算-云原生安全可信计算,物理-硬件-系统-云产品-云平台,数据安全防护
  • PHP服务器端电商API原理及示例讲解(电商接口开发/接入)
  • Spring Cloud应用- Eureka原理、搭建
  • Servlet 设置启动时机(web.xml方式和@WebServlet方式)
  • 一个使用uniapp+vue3+ts+pinia+uview-plus开发小程序的基础模板
  • Kali安装docker
  • Maven第七章:Maven工程最佳实践
  • 【深度学习】【pytorch】对卷积层置零卷积核进行真实剪枝
  • 机器人仿真-gazebo学习笔记(3)URDF和机器人模型
  • lua-resty-request库写入爬虫ip实现数据抓取
  • gitlab Activating and deactivating users