当前位置: 首页 > news >正文

Spark Yarn 运行环境搭建

文章目录

  • Spark Yarn 运行环境搭建
    • 1、解压缩文件
    • 2、修改配置环境文件
    • 3、配置历史服务器

Spark Yarn 运行环境搭建

1、解压缩文件

将spark3.2.3的压缩包上传到 linux /opt/software 目录下
在这里插入图片描述
输入命令: tar -zxvf spark-3.2.3-bin-hadoop3.2-scala2.13.tgz -C /opt/ 解压到opt目录下
输入命令: mv spark-3.2.3-bin-hadoop3.2-scala2.13/ spark 改名为spark
在这里插入图片描述

2、修改配置环境文件

1、修改 hadoop 配置文件/opt/hadoop/etc/hadoop/yarn-site.xml, 并分发
输入命令:vim /opt/hadoop-3.1.3/etc/hadoop/yarn-site.xml
在这里插入图片描述
2、修改 conf/spark-env.sh,添加 JAVA_HOME 和YARN_CONF_DIR 配置
输入命令:mv spark-env.sh.template spark-env.sh 把这个文件后缀名改一下
在这里插入图片描述
输入命令: vim spark-env.sh 添加下面的配置
在这里插入图片描述
3、启动 HDFS 以及 YARN 集群

3、配置历史服务器

1、修改 spark-defaults.conf.template 文件名为 spark-defaults.conf
输入命令:mv spark-defaults.conf.template spark-defaults.conf
在这里插入图片描述
2、修改 spark-default.conf 文件,配置日志存储路径
输入命令: vim spark-defaults.conf 添加以下配置
在这里插入图片描述
注意:需要启动 hadoop 集群,HDFS 上的目录需要提前存在。
3、修改 spark-env.sh 文件, 添加日志配置
在这里插入图片描述

export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080
-Dspark.history.fs.logDirectory=hdfs://hadoop102:9870/directory
-Dspark.history.retainedApplications=30"

参数说明
⚫参数 1 含义:WEB UI 访问的端口号为 18080
⚫参数 2 含义:指定历史服务器日志存储路径
⚫参数 3 含义:指定保存Application 历史记录的个数,如果超过这个值,旧的应用程序信息将被删除,这个是内存中的应用数,而不是页面上显示的应用数。
4、修改 spark-defaults.conf
输入命令: vim spark-defaults.conf 添加以下配置
在这里插入图片描述

spark.yarn.historyServer.address=hadoop102:18080 
spark.history.ui.port=18080

5、启动历史服务
输入命令: /opt/spark/sbin/start-history-server.sh
在这里插入图片描述

http://www.lryc.cn/news/34775.html

相关文章:

  • SpringMVC 页面跳转指南:转发和重定向的实现与比较
  • ModStartCMS v5.9.0 后台浅色模式,系统样式升级
  • 2020蓝桥杯真题反倍数 C语言/C++
  • PTA:L1-025 正整数A+B、L1-026 I Love GPLT、L1-027 出租(C++)
  • 状态机的Go语言实现版本
  • 第2章 线程安全与共享资源竞争
  • 77. writerows写入多行
  • STM32MP157-Linux输入设备应用编程-多点触摸屏编程
  • mybatis-plus的一般实现过程(超详细)
  • Spark(5):RDD概述
  • 面向对象 - 继承
  • 计算机网络的166个概念你知道几个 第十二部分
  • 【RabbitMQ】RabbitMQ各版本的兼容性与技术支持时限
  • 【Git】P5 Git 远程仓库(3)pull 发生冲突
  • 关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解
  • 企业防护ddos的注意事项,你知道吗?
  • RocketMQ如何测试
  • SpringBoot中的bean注入方式和原理介绍
  • ESP32设备驱动-RFID-RC522模块驱动
  • SMETA认证有些客户是需要做窗口期的
  • 面向对象设计模式:创建型模式之原型模式
  • 三维重建(单目、双目、多目、点云、SFM、SLAM)
  • Java中的final和权限修饰符
  • MySQL的基本语句(SELECT型)
  • 日志服务搭建-ES-FileBeat-Kibana
  • 大数据架构设计与数据计算流程
  • 207. 课程表
  • 2023-03-08 mysql列存储数据库-查询执行过程分析
  • 各种激活函数的计算公式、图像以及实现代码
  • ArangoDB