当前位置: 首页 > news >正文

spark独立集群搭建

spark独立集群搭建(不依赖Hadoop)

1、上传spark-2.4.5-bin-hadoop2.7.tgz至 /usr/local/moudel ,再解压到 /usr/local/soft
    
   tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz -C /usr/local/soft/
   
   
重命名
   mv spark-2.4.5-bin-hadoop2.7/ spark-2.4.5


配置环境变量   
   vim /etc/profile
   
   添加 
   export SPARK_HOME=/usr/local/soft/spark-2.4.5
   
   在path后面添加   :$SPARK_HOME/bin
   

2、进入 spark-2.4.5/conf 目录 ,修改配置文件
   修改主节点配置文件
   cp spark-env.sh.template spark-env.sh
   
   vim spark-env.sh
   
   直接在文件最下方添加
   export SPARK_MASTER_IP=master
   export SPARK_MASTER_PORT=7077

   export SPARK_WORKER_CORES=2
   export SPARK_WORKER_INSTANCES=1
   export SPARK_WORKER_MEMORY=2g
   export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
   
   
   修改从节点配置文件
   cp slaves.template slaves
   
   vim slaves
   
   
   删除localhost 添加
   node1
   node2
   

3、复制到其它节点
   cd /usr/local/soft
   
   scp -r spark-2.4.5/ node1:`pwd`
   scp -r spark-2.4.5/ node2:`pwd`
   

4、在master节点 spark的sbin目录下启动spark
   cd /usr/local/soft/spark-2.4.5/sbin
   
   ./start-all.sh
   


   
   http://master:8080/  访问spark UI       ---- spark独立集群安装完成
   

5、测试
   spark有两种模式 :
   (1) standalone client模式   日志在本地输出,一般用于上线前测试(bin/下执行)

    cd /usr/local/soft/spark-2.4.5/examples/jars

    提交spark任务
    spark-submit --class org.apache.spark.examples.SparkPi --master spark://master:7077 --executor-memory 512m --total-executor-cores 1 spark-examples_2.11-2.4.5.jar 100


    (2) standalone cluster模式   上线使用,不会再本地打印日志 需要到网页查看结果
    

    cd /usr/local/soft/spark-2.4.5/examples/jars
    
    提交spark任务
    spark-submit --class org.apache.spark.examples.SparkPi --master spark://master:7077 --executor-memory 512M --total-executor-cores 1 --deploy-mode cluster spark-examples_2.11-2.4.5.jar 100

------------ 以后都不会使用的  -----------------

===================== 若集群已有yarn , 就不需要再搭建Spark独立集群了  ==================================================================   
以后都会使用 整合 yarn

http://www.lryc.cn/news/376310.html

相关文章:

  • 【BFS算法】广度搜索·由起点开始逐层向周围扩散求得最短路径(算法框架+题目)
  • 微信小程序---登录
  • IPython大师课:提升数据科学工作效率的终极工具
  • 抖音素材网站平台有哪些?素材下载网站库分享
  • MODBUS TCP协议实例数据帧详细分析
  • Spring Boot启动与运行机制详解:初学者友好版
  • Ubuntu 22.04 解决 firefox 中文界面乱码
  • 前端面试题日常练-day77 【面试题】
  • 团队协同渗透测试报告输入输出平台部署
  • vue3-父子通信
  • 微信小程序—页面滑动,获取可视区域数据
  • C#语言进阶(一)—委托
  • VST3音频插件技术介绍
  • MySQL数据库管理 二
  • android system UI 基础的基础
  • ARM32开发——GD32F4定时器查询
  • 【机器学习】第7章 集成学习(小重点,混之前章节出题但小题)
  • 代码随想录——子集Ⅱ(Leecode 90)
  • vue关闭页面时触发的函数(ai生成)
  • 马尔可夫性质与Q学习在强化学习中的结合
  • 【LeetCode 5.】 最长回文子串
  • 联邦学习周记|第四周
  • 机器学习课程复习——逻辑回归
  • Rocky Linux 更换CN镜像地址
  • Linux rm命令由于要删的文件太多报-bash: /usr/bin/rm:参数列表过长,无法删除的解决办法
  • 【包管理】Node.JS与Ptyhon安装
  • SpringMVC系列四: Rest-优雅的url请求风格
  • Hexo 搭建个人博客(ubuntu20.04)
  • 【论文阅读】-- Attribute-Aware RBFs:使用 RT Core 范围查询交互式可视化时间序列颗粒体积
  • A类IP介绍