当前位置: 首页 > news >正文

Spark-Yarn模式如何配置历史服务器

在Spark程序结束之后我们也想看到运行过程怎么办?

Yarn模式下,通过以下步骤配置历史服务器即可:

  1. mv spark-defaults.conf.template spark-defaults.conf
  2. 修改spark-default.conf 文件,配置日志存储路径
spark.eventLog.enabled true
spark.eventLog.dir hdfs://master:9000/directory

注意:需要启动hadoop集群;如果directory不存在,先用如下命令创建
hdfs dfs -mkdir /directory或hadoop dfs -mkdir /directory或hadoop fs -mkdir directory
这里的端口号和Hadoop的core-site.xml中fs.defaultFS的路径保持一致
3. 修改spark-env.sh文件,配置日志

export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080 
-Dspark.history.fs.logDirectory=hdfs://master:9000/directory 
-Dspark.history.retainedApplications=30"

WEB UI访问的端口号
指定历史服务器日志存储路径
指定Application历史纪录的保存个数,这个是内存中的应用数,不是页面上显示的应用数

  1. 修改 spark-defaults.conf
spark.yarn.historyServer.address=master:18080
spark.history.ui.port=18080
  1. 启动历史服务
sbin/start-history-server.sh
  1. 用spark-submit提交任务
  2. Web页面查看日志:http://master:8088

在这里插入图片描述

  1. 点击history之后:

在这里插入图片描述

http://www.lryc.cn/news/432220.html

相关文章:

  • Maven的安装
  • iOS——APP启动流程
  • LLM模型:代码讲解Transformer运行原理
  • 虚幻引擎VR游戏开发02 | 性能优化设置
  • Web应用监控:URL事务监测指标解读
  • redis之缓存淘汰策略
  • CMake/C++:一个日志库spdlog
  • rig——管理不同R语言版本的工具
  • Java内存模型详解
  • 空气能热泵热水器
  • 计算机毕业设计选题推荐-消防站管理系统-社区消防管理系统-Java/Python项目实战
  • 移动UI:新手指引页面,跟着指引不迷路。
  • 数据库MySQL基础
  • AUTOSAR_EXP_ARAComAPI的5章笔记(3)
  • 【Godot4.3】基于纯绘图函数自定义的线框图控件
  • 申万宏源证券完善金融服务最后一公里闭环,让金融服务“零距离、全天候”
  • 无需更换摄像头,无需施工改造,降低智能化升级成本的智慧工业开源了。
  • 系统架构师考试学习笔记第三篇——架构设计高级知识(19)嵌入式系统架构设计理论与实践
  • centos8stream 修改为阿里云yum源
  • python转换并提取pdf文件中的图片
  • 【MySQL】MySQL常用的数据类型——表的操作
  • 自然语言处理系列五十三》文本聚类算法》文本聚类介绍及相关算法
  • 计算机网络(一) —— 网络基础入门
  • 从监控到智能:EasyCVR视频汇聚平台助力加油站安全监管升级转型
  • 日志服务管理
  • ROS 工具箱系统要求
  • CSS解析:定位和层叠上下文
  • 无名管道与有名管道的区别(C语言)
  • Vue+Nginx前端项目多种方式部署一文搞定(练习源码自取)
  • MATLAB 中双引号 ““ 和单引号 ‘‘ 的区别详解