当前位置: 首页 > news >正文

搭建hadoop+spark完全分布式集群环境

目录

一、集群规划

二、更改主机名

 三、建立主机名和ip的映射

四、关闭防火墙(master,slave1,slave2)

五、配置ssh免密码登录

六、安装JDK

七、hadoop之hdfs安装与配置

1)解压Hadoop

2)修改hadoop-env.sh

3)修改 core-site.xml

4)修改hdfs-site.xml

5) 修改slave

八、配置hadoop环境变量

九、将hadoop拷贝到其他主机、

十、格式化元数据目录

十一、下载安装spark

十二、配置文件修改

1)复制模板文件

2)配置spark-env.sh(增加环境变量)

3) 配置slaves

4) 将master配置好的spark 拷贝到slave1,slave2

5) 配置环境变量

6)启动与验证

7)提交jar 包并观察验证

一、集群规划

主机名

操作系统

地址

角色

硬件配置

master

Centos

10.1.0.248

namenode

2g 1核

slaver1

Centos

10.1.0.94

datanode

1g 1核

slaver2

Centos

10.1.0.31

datanode

1g 1核

二、更改主机名

分别修改主机名文件(重启永久生效)

sudo vi  /etc/sysconfig/network

 三、建立主机名和ip的映射

sudo vi /etc/hosts

 拷贝到slave1和slave2中

四、关闭防火墙(master,slave1,slave2

关闭防火墙:sudo service iptables stop  

关闭防火墙自启:sudo chkconfig iptables off

五、配置ssh免密码登录

ssh-keygen -t rsa

ssh-copy-id mast

http://www.lryc.cn/news/401524.html

相关文章:

  • pytorch-pytorch之LSTM
  • jvm优化
  • 网络安全——防御课实验二
  • 朴素模式匹配算法与KMP算法(非重点)
  • [k8s源码]2.CURD deployment
  • 使用base64通用文件上传
  • Python深度学习
  • django报错(三):No crontab program或got an unexpected keyword argument ‘user’
  • 数据库(创建数据库和表)
  • Log4j的原理及应用详解(一)
  • ubuntu系统Docker常用命令
  • 韦东山嵌入式linux系列-驱动设计的思想(面向对象/分层/分离)
  • 0/1背包
  • Linux的进程和权限的基本命令
  • 鼠标录制工具怎么挑选?9款电脑鼠标录制工具分享(2024)
  • C1W4.LAB.Vector manipulation+Hash functions and multiplanes
  • YOLOv8改进 | 检测头 | 融合渐进特征金字塔的检测头【AFPN4】
  • 数据采集监控平台:挖掘数据价值 高效高速生产!
  • 【算法笔记自学】第 9 章 提高篇(3)——数据结构专题(2)
  • Objective-C 中字符串的保存位置
  • git 想要创建一个新的本地分支并检出远程分支的内容
  • C语言学习笔记[24]:循环语句while②
  • 安全运营概述
  • spring-cloud和spring-cloud-alibaba的关系
  • 持续集成06--Jenkins构建触发器
  • 根据视图矩阵, 恢复相机的世界空间的位置
  • 使用pytest-playwright截图和录制视频并添加到Allure报告
  • pytorch GPU cuda 使用 报错 整理
  • python + Pytest + requests 的接口自动化步骤
  • 基于若依的ruoyi-nbcio流程管理系统修正自定义业务表单的回写bug