当前位置: 首页 > news >正文

大数据-81 Spark 安装配置环境 集群环境配置 超详细 三台云服务器

点一下关注吧!!!非常感谢!!持续更新!!!

目前已经更新到了:

  • Hadoop(已更完)
  • HDFS(已更完)
  • MapReduce(已更完)
  • Hive(已更完)
  • Flume(已更完)
  • Sqoop(已更完)
  • Zookeeper(已更完)
  • HBase(已更完)
  • Redis (已更完)
  • Kafka(已更完)
  • Spark(正在更新!)

章节内容

上节我们完成了:

  • Spark 简单介绍
  • Spark 的特点
  • Spark 与 Hadoop MapReduce 框架对比
  • Spark的系统架构
  • Spark的部署模式

在这里插入图片描述

下载文件

我们到官方地址下载:

https://archive.apache.org/dist/spark/

页面如下,为了保证稳定和学习的方便,我用了比较老的版本:2.4.5
在这里插入图片描述
我们选择:without-hadoop-scala 这种版本,可以不用安装配置 Scala:

https://archive.apache.org/dist/spark/spark-2.4.5/spark-2.4.5-bin-without-hadoop-scala-2.12.tgz

在这里插入图片描述

解压配置

我们可以使用 wget 或者其他工具来完成文件的下载,我这里是传到服务器上:

cd /opt/software/
wget https://archive.apache.org/dist/spark/spark-2.4.5/spark-2.4.5-bin-without-hadoop-scala-2.12.tgz

在这里插入图片描述
下载完成后,我们进行解压并移动到指定位置:

cd /opt/software/
tar zxvf spark-2.4.5-bin-without-hadoop-scala-2.12.tgz

在这里插入图片描述
移动目录到servers下(之前的规范):

mv spark-2.4.5-bin-without-hadoop-scala-2.12 ../servers

在这里插入图片描述

环境变量

vim /etc/profile
# spark
export SPARK_HOME=/opt/servers/spark-2.4.5-bin-without-hadoop-scala-2.12
export PATH=$PATH:$SPARK_HOME/bin

配置完的结果,记得刷新环境变量
在这里插入图片描述

修改配置

cd $SPARK_HOME/conf

slaves

mv slaves.template slaves
vim slaves# 集群地址
h121.wzk.icu
h122.wzk.icu
h123.wzk.icu

配置完的样子大概如下:
在这里插入图片描述

spark-defaults

mv spark-defaults.conf.template spark-defaults.conf
vim spark-defaults.conf# 修改配置的信息
spark.master spark://h121.wzk.icu:7077
spark.eventLog.enabled true
spark.eventLog.dir hdfs://h121.wzk.icu:9000/spark-eventLog
spark.serializer org.apache.spark.serializer.KryoSerializer
spark.driver.memory 512m

配置完的结果如下图:
在这里插入图片描述

创建HDFS目录

hdfs dfs -mkdir /spark-eventLog

spark-env

mv spark-env.sh.template spark-env.sh
vim spark-env.sh# 修改如下的配置内容
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export HADOOP_HOME=/opt/servers/hadoop-2.9.2
export HADOOP_CONF_DIR==/opt/servers/hadoop-2.9.2/etc/hadoop
export SPARK_DIST_CLASSPATH=$(/opt/servers/hadoop-2.9.2/bin/hadoop classpath)
export SPARK_MASTER_HOST=h121.wzk.icu
export SPARK_MASTER_PORT=7077

配置完成截图如下:
在这里插入图片描述

分发软件

传输文件

使用我们之前编写的 rsync-script 工具。当然你也可以每台都配置一次也行,只要保证环境一致即可。
(之前Hadoop等都使用过,如果你没有,你可以用复制或者别的方式)

rsync-script /opt/servers/spark-2.4.5-bin-without-hadoop-scala-2.12

过程会很漫长,请耐心等待:
在这里插入图片描述
文件传输分发完毕:
在这里插入图片描述

环境变量

每天机器都需要配置环境变量!!!

/etc/profile

h122 服务器

在这里插入图片描述

h123 服务器

在这里插入图片描述

http://www.lryc.cn/news/424134.html

相关文章:

  • C#创建一个自定义控件类
  • springboot牙科就诊管理系统--论文源码调试讲解
  • CUDA+tensorflow+python+vscode在GPU下环境安装及问题汇总与解答
  • 24/8/14算法笔记 复习_逻辑回归sigmoid
  • MySQL忘记/无root密码,强制修改root密码
  • 探索 MongoDB 的 $currentDate:解决 TTL 时间不同步问题的利器
  • defineModel
  • 去中心化技术的崛起:探索Web3的新时代
  • GNU/Linux - copy_{to,from}_user: 用户和内核空间的内存互拷贝
  • 进阶岛任务1: 探索 InternLM 模型能力边界
  • RabbitMQ实现多线程处理接收消息
  • AI智能网关 边缘计算 视觉AI
  • Java基础之原反补码
  • Unity如何使用Spine动画导出的动画
  • 变量位操作
  • 内网渗透—横向移动RDPWinRMWinRSSPN扫描Kerberos攻击
  • Python套接字综合应用(UDP篇)
  • 服务器安装哪吒面板详细教程
  • LLM微调(精讲)-以高考选择题生成模型为例(DataWhale AI夏令营)
  • 安全基础学习-RC4加密算法
  • 雨云宁波电信大带宽服务器测评(非广告)
  • 2024年,最新前端趋势
  • Linux静态进程和动态进程查看管理
  • CPU飙升 怎么定位问题
  • The Sandbox 游戏制作教程第 4 章|使用装备制作游戏,触发独特互动
  • JS 和 JSX、TS 和 TSX 的区别
  • 25款极氪007上市,小米SU7就不该买?
  • 旋转字符串 | LeetCode-796 | 模拟 | KMP | 字符串匹配
  • 网络安全测试工具Burp Suite基本使用
  • 使用pytest+selenium编写网页UI自动化脚本和用例