当前位置: 首页 > news >正文

大数据集群管理软件 CDH、Ambari、DataSophon 对比

文章目录

  • 引言
  • 工具介绍
    • CDH
    • Ambari
    • DataSophon
  • 对比分析

引言

  大数据集群管理方式分为手工方式和工具方式,手工方式一般指的是手动维护平台各个组件,工具方式是靠大数据集群管理软件对集群进行管理维护。本文针对于常见的方法和工具进行比较,帮助找到合适的工具,提升效率。

工具介绍

CDH

  CDH 是 Cloudera 公司提供的一种大数据平台解决方案。 CDH 的全称是 Cloudera’s Distribution including Apache Hadoop,它是一个开放源代码的大数据平台,基于 Apache Hadoop 和其他相关的开源技术构建,包括 HDFS、MapReduce、HBase、ZooKeeper、Hue、Oozie、Flume、Sqoop 等等。
  CDH 提供了一个完整的大数据解决方案,包括数据管理、数据处理、数据分析和数据可视化等方面,可以帮助用户快速搭建和部署大数据平台,支持多种数据源的处理和集成,同时提供了强大的安全性和可扩展性。值得一提的是 CDH 从6.3版本之后开始收费 。

官网地址:https://www.cloudera.com/

Ambari

  Apache Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目。目前最新的发布版本是 2.7.8。就 Ambari 的作用来说,就是创建、管理、监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。用一句话来说,Ambari 就是为了让 Hadoop 以及相关的大数据软件更容易使用的一个工具。Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop 和 Hcatalog 等,并且是完全开源的平台。

官网地址:https://ambari.apache.org/

DataSophon

   DataSophon 是致力于自动化监控、运维、管理大数据基础组件和节点的,帮助您快速构建起稳定,高效的大数据集群服务,国产开源平台,支持完全离线部署,能支撑

官网地址:https://datasophon.github.io/datasophon-website/docs/current/%E6%A6%82%E8%A7%88

支持组件列表
还支持 Kyuubi(统一多租户JDBC网关)、Iceberg(适用于庞大数据集分析的开放式数据表格式)、Kerberos(计算机网络认证协议)

对比分析

试想下面几个问题:

  1. 如果有100台服务器的集群,至少要花费多长时间搭建好 Hadoop集群?包括 Hive、Hbase、Spark、Zookeeper、Kafka、Flink 等?
  2. 对于以上集群进行 Hadoop 版本升级,怎么选择升级方案?至少要花费多长时间?
  3. 新版本的 Hadoop 与 Hvie、Hbase、Kafka、Flink 等是否兼容?
  4. 如何对上述集群中已经运行中的主机和组件健康状态进行监控?

手工部署:需配置太多参数,但是,好理解其原理,建议初学这样做,能学到很多。该方式啊,均得由用户执行,细节太多,切当设计多个组件时,用户须自己解决组件间版本兼容问题。

工具部署:使用工具可以说是一键操作,难点都在工具本身的部署上,但是工具也存在升级组件不受自己控制的弊端。

比较项手工方式工具方式
难易度难,几乎不可能成功简单,易行
兼容性自己解决组件兼容性问题自动安装兼容组件
组件支持数支持全部组件支持常用组件
监控运维无,需要自建支持常见组件的监控
优点对组件和集群管理深刻简单、容易、可行
缺点太复杂,几乎不可能成功屏蔽太多细节,妨碍对组件理解

组件之间对比:

工具项所属机构开源性社区支持性易用性监控指标可扩展性原生支持组件服务版本
CDHCloudera商用不支持较老
AmbariApache开源支持较易较多较强较少较新
DataSophon国产开源支持非常新
http://www.lryc.cn/news/308237.html

相关文章:

  • 插值、逼近、拟合、光顺
  • Java单元测试 - mock静态方法
  • Unity使用PlayableAPI 动态播放动画
  • unity使用Registry类将指定内容写入注册表
  • Python进阶学习:Pandas--将一种的数据类型转换为另一种类型(astype())
  • OpenCV开发笔记(七十五):相机标定矫正中使用remap重映射进行畸变矫正
  • 光伏预测 | Matlab基于CNN-SE-Attention-ITCN的多特征变量光伏预测
  • k8s学习笔记-基础概念
  • C语言 变量
  • 2024年2月16日优雅草蜻蜓API大数据服务中心v1.1.1大更新-UI全新大改版采用最新设计ui·增加心率计算器·退休储蓄计算·贷款还款计算器等数接口
  • WEB漏洞 逻辑越权之支付数据篡改安全
  • 45、WEB攻防——通用漏洞PHP反序列化POP链构造魔术方法原生类
  • 雾锁王国服务器怎么建?雾锁王国服务器搭建方法
  • 设计模式篇---观察者模式
  • Docker常用命令Top20
  • Redis的发布订阅机制及其使用场景
  • 计算机网络的基础知识
  • QT-Http post 同步请求
  • 【JVM】StringTable 字符串常量池
  • Unity中URP实现水体(水的焦散)
  • vue构建版本
  • Docker挂载镜像到本地(日常记录)
  • 【Elasticsearch查询】精确查询
  • 小狐狸chat2.7.2免授权修复版可用版
  • 通过QScrollArea寻找最后一个弹簧并且设置弹簧大小
  • 為什麼使用海外動態代理IP進行網路爬蟲?
  • LeetCode 热题100 刷题笔记
  • veridata安装
  • 面试笔记系列三之spring基础知识点整理及常见面试题
  • 面试笔记系列四之SpringBoot+SpringCloud+计算机网络基础知识点整理及常见面试题