当前位置: 首页 > news >正文

CDH大数据平台集群部署

文章目录

  • 1. 资源准备
  • 2. 部署 Mariadb 数据库
  • 3. 安装CM服务
  • 4. 安装数据节点
  • 5. 登录CM系统

1. 资源准备

  准备好CDH安装包资源,官方网站下载需要账号,如果没有账号可以去网上到处搜搜。主要涉及到的资源有:

  • cloudera-manager-server
  • cloudera-manager-daemons
  • cloudera-manager-agent
  • mysql-connector-java.jar
  • CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel 以及相关校验值

2. 部署 Mariadb 数据库

  • 安装 mariadb 服务
yum install mariadb-server
  • 启动数据库
systemctl enable mariadb
systemctl start mariadb
  • 初始化数据库配置
mysql_secure_installation

  若CM服务与数据库不在同一台机器上,需要对数据库进行设置,使其允许其他机器IP远程访问数据库。这点非常重要,否则将会导致CM初始化数据库失败。

3. 安装CM服务

  • 安装CM程序
yum install cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm
  • 修改数据库配置
vim /etc/cloudera-scm-server/db.properties
# Copyright (c) 2012 Cloudera, Inc. All rights reserved.
#
# This file describes the database connection.
## The database type
# Currently 'mysql', 'postgresql' and 'oracle' are valid databases.
com.cloudera.cmf.db.type=mysql# The database host
# If a non standard port is needed, use 'hostname:port'
com.cloudera.cmf.db.host=mariadb-server-ip:port# The database name
com.cloudera.cmf.db.name=cmf# The database user
com.cloudera.cmf.db.user=<用户名># The database user's password
com.cloudera.cmf.db.password=<数据库密码># The db setup type
# After fresh install it is set to INIT
# and will be changed post config.
# If scm-server uses Embedded DB then it is set to EMBEDDED
# If scm-server uses External DB then it is set to EXTERNAL
com.cloudera.cmf.db.setupType=EXTERNAL
  • 添加mysql驱动程序
cp mysql-connector-java-6.0.6.jar /usr/share/java/mysql-connector-java.jar
  • 复制CDH安装包到/opt/cloudera/parcel-repo目录
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel  
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha  
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1  
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256  
manifest.json
  • 启动 cloudera-scm-server 服务
systemctl start cloudera-scm-server

4. 安装数据节点

  CM服务是集群的管理节点,CM负责管理大数据集群内所有的数据节点,数据节点上需要部署 agent 服务,agent服务负责与CM服务通信,CM 服务通过 agent 服务来管理集群内所有的数据节点。

  • 安装 agent 服务
yum install cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm
  • 修改 agent 配置
vim /etc/cloudera-scm-agent/config.ini 
[General]
# Hostname of the CM server.
server_host=k8s-node1# Port that the CM server is listening on.
server_port=7182
  • 启动 agent 服务
systemctl start cloudera-scm-agent

5. 登录CM系统

  CM服务默认端口是 7180, 默认账号以及初始密码是:admin/admin。请确保 7180 端口没有被防火墙禁止。登录系统后将会做基础的配置,根据需要选择合适的版本,企业版需要购买License,Express 版本免费使用,但是支持的功能有限。
在这里插入图片描述

  • 版本选择完成后进入到配置服务的页面,
    在这里插入图片描述
  • 设置集群名称
  • 在这里插入图片描述
  • Express 版本最大支持100个主机,这一步主要设置主机名,建议将 hostname 设置成 CM 机器的主机名,选择Currently Managed Hosts 选项卡,将会显示出所有的 agent 节点。如果需要添加新节点,可以选择 New Hosts 选项卡进行操作。New Hosts 选项卡中添加新节点,需要有软件包管理服务。
    在这里插入图片描述
  • 开始安装Parcels
    在这里插入图片描述
      后续流程不在一一截图展示,根据提示进行操作,即可完成CDH的安装部署。基于CDH部署一套大数据平台比较容易,难点在于真正发挥大数据业务分析价值,不然淡出的搭建一套大数据平台而没有具体的有价值的业务去实践,有点浪费资源。
    在这里插入图片描述
http://www.lryc.cn/news/173416.html

相关文章:

  • 基于springboot+vue的校园资产管理系统
  • @RequestMapping 注解使用技巧
  • AtCoder 265G 线段树
  • 通俗易懂了解大语言模型LLM发展历程
  • Vim - 快速插入C语言函数注释模板
  • Leetcode171. Excel 表列序号
  • 自主设计,模拟实现 RabbitMQ - 实现 拒绝/否定 应答机制
  • 在github上设置不同分支,方便回滚
  • 【Elsevier旗下】JCR2/3区,最快25天录用!计算机与娱乐、教育、游戏、新媒体均可
  • TSINGSEE视频AI智能分析技术:水泥厂安全生产智能监管解决方案
  • Whisper + NemoASR + ChatGPT 实现语言转文字、说话人识别、内容总结等功能
  • 795. 区间子数组个数
  • Request method ‘GET‘ not supported,不支持GET形式访问
  • 数据结构与算法(C语言版)P2---线性表之顺序表
  • AI写文章软件-怎么选择不同的AI写文章软件
  • VSCode远程连接服务器报错:Could not establish connection to
  • openssl 用法整理 —— 筑梦之路
  • Mac安装SPSS 26(含安装包)
  • uniapp存值和取值方法
  • Apache Beam 2.50.0发布,该版本包括改进功能和新功能
  • 华为云云耀云服务器 L 实例评测|配置教程 + 用 Python 简单绘图
  • 栈的简单应用(利用Stack进行四则混合运算)(JAVA)
  • Python---异常
  • 视频编解码器H.264和H265有什么区别?
  • 网络安全进阶学习第十六课——业务逻辑漏洞介绍
  • 华为OD:跳房子I
  • C语言自定义类型详解(1)结构体知识汇总
  • 小程序中如何查看会员的访问记录
  • SpringCloud Alibaba - Sentinel
  • 内存泄漏,内存溢出,抽象类和接口,netstat、ping、ifconfig的区别