当前位置: 首页 > news >正文

spark 整合 yarn

spark 整合 yarn


1、在master节点上停止spark集群    
    cd /usr/local/soft/spark-2.4.5/sbin
   
    ./stop-all.sh

    
2、spark整合yarn只需要在一个节点整合, 可以删除node1 和node2中所有的spark文件

    分别在node1、node2 的/usr/local/soft目录运行
    rm -rf spark-2.4.5/
    

3、 进入 /spark-2.4.5/conf目录,增加 hadoop 配置文件地址
    cp /usr/local/soft/spark-2.4.5/conf
    
    vim spark-env.sh
    
    直接在文件最后加上
    export HADOOP_CONF_DIR=/usr/local/soft/hadoop-2.7.6/etc/hadoop
    

4、 进入/usr/local/soft/hadoop-2.7.6/etc/hadoop目录,修改yarn-site.xml文件(往yarn提交任务需要增加两个配置)
 
    先关闭yarn
    stop-all.sh
    
    cd /usr/local/soft/hadoop-2.7.6/etc/hadoop
    
    vim yarn-site.xml
    
    
    在<configuration> </configuration>之间加上 :
    <property>
    <name>yarn.nodemanager.pmem-check-enabled</name>
    <value>false</value>
    </property>

    <property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
    </property>
    

5、同步到其他节点
    cd /usr/local/soft/hadoop-2.7.6/etc/hadoop
    
    scp -r yarn-site.xml node1:`pwd`
    scp -r yarn-site.xml node2:`pwd`
    


    
    再启动yarn
    start-all.sh
    
    
    master:50070  -- 检查HDFS 
    master:8088   -- 检查Yarn
    
    
6、测试
   spark有两种模式 :
   (1) standalone client模式   日志在本地输出,一般用于上线前测试(bin/下执行)

    cd /usr/local/soft/spark-2.4.5/examples/jars

    提交spark任务
    spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client spark-examples_2.11-2.4.5.jar 100


    (2) standalone cluster模式   上线使用,不会再本地打印日志   减少io
    
    cd /usr/local/soft/spark-2.4.5/examples/jars
    
    提交spark任务
    spark-submit --class org.apache.spark.examples.SparkPi --master yarn-cluster spark-examples_2.11-2.4.5.jar 100
    
    
    
    获取yarn程序 cluster模式 下的执行日志 , 执行成功之后才能获取到
    yarn logs -applicationId application_1560967444524_0003

http://www.lryc.cn/news/377198.html

相关文章:

  • 蓝桥杯十五届国赛模拟题1答案
  • 分布式之日志系统平台ELK
  • git常见错误
  • 构建稳定高效的消息传递中间件:消息队列系统的设计与实现
  • 支持 MKV、MP4、AVI、MPG 等格式视频转码器
  • yum
  • 【单片机毕业设计选题24016】-基于STM32和阿里云的采空区环境监测系统设计
  • Leetcode3179. K 秒后第 N 个元素的值
  • vue3第二阶段的开发文档
  • 【网络安全学习】漏洞扫描:- 02- nmap漏洞扫描
  • Web开发技能树-HTML-class/id/name/tag
  • 据APO Research(阿谱尔)统计,2023年全球乳酸企业产能约119.3万吨
  • 百度文心智能体平台(想象即现实):轻松上手,开启智能新时代!创建属于自己的智能体应用。
  • Linux中ls -lsa 和ls -lst区别
  • TDengine 签约上海晶澳太阳能,助力储能业务平台搭建
  • 【数据结构】选择题
  • 数据库 |试卷八试卷九试卷十
  • 【华为HCIA数通网络工程师真题-构建互联互通的IP网络】
  • Kafka 负载均衡挑战及解决思路
  • 【Java面试】二十一、JVM篇(中):垃圾回收相关
  • 深入理解预处理
  • DSP28335:定时器
  • 系统架构理解
  • uni-app页面的跳转三种方式,功能作用有什么区别?
  • React 通信:深层传递(Props、Context、Children Jsx)
  • 《Windows API每日一练》5.1 键盘基础
  • Class.forName()方法总结
  • Python | Leetcode Python题解之第168题Excel表列名称
  • 【ARMv8/ARMv9 硬件加速系列 3.5.2 -- SVE 向量寄存器 有多少位数?】
  • Vulkan入门系列2- 绘制三角形(未完待续)