当前位置: 首页 > news >正文

Linux安装 spark 教程详解

目录

一 准备安装包

二 安装 scala

三 修改配置文件

1)修改 workers 文件

2)修改 spark-env.sh文件

四 进入 spark 交互式平台


一 准备安装包

        可以自行去 spark 官网下载想要的版本

        这里准备了 spark3.1.2的网盘资源

链接: https://pan.baidu.com/s/1Brm6XqaqYQnXQwOd8mUt7A?pwd=2bye 提取码: 2bye

        下载后上传至 linux 服务器上

        这里放在了 /opt/install 目录

        解压至 /opt/soft 目录

tar -zxf /opt/install/spark-3.1.2-bin-hadoop3.2.tgz -C /opt/soft/

        改个名

cd /opt/soft
mv spark-3.1.2-bin-hadoop3.2/ spark312

        修改一下环境变量 

#SPARK_HOME
export SPARK_HOME=/opt/soft/spark312
export PATH=$SPARK_HOME/bin:$PATH

二 安装 scala

        安装过scala的 朋友可以跳过此步骤

        scala 的安装比较简单,spark 的运行环境需要 scala

        这里同样准备了网盘资源

链接: https://pan.baidu.com/s/1ua01OvTYjFQyG82AG1g1yg?pwd=imc6 提取码: imc6

        下载后上传至 linux 服务器上

        这里放在了 /opt/install 目录

        解压至 /opt/soft 目录

tar -zxf /opt/install/scala-2.12.10.tgz -C /opt/soft/

        解压后改个名

mv scala-2.12.10/ scala212

        修改环境变量,末尾添加下面内容

#SCALA_HOME
export SCALA_HOME=/opt/soft/scala212
export PATH=$SCALA_HOME/bin:$PATH

        修改后保存退出,source一下

 source /etc/profile

三 修改配置文件

        进入 spark312/conf 目录

        将 两个临时文件cp 一下

cp spark-env.sh.template spark-env.sh
cp workers.template workers

1)修改 workers 文件

vim workers

        由于这里就是单机版,所以就不做修改

 

2)修改 spark-env.sh文件

vim spark-env.sh

         添加配置,这里根据自己的各个安装包的位置来

export SCALA_HOME=/opt/soft/scala212
export JAVA_HOME=/opt/soft/jdk180
export SPARK_HOME=/opt/soft/spark312
export HADOOP_INSTALL=/opt/soft/hadoop313
export HADOOP_CONF_DIR=$HADOOP_INSTALL/etc/hadoop
export SPARK_MASTER_IP=172.25.38.169
export SPARK_DRIVER_MEMORY=2G
export SPARK_EXECUTOR_MEMORY=2G
export SPARK_LOCAL_DIRS=/opt/soft/spark312

四 进入 spark 交互式平台

        输入命令回车

 spark-shell

         未给参数默认等同于下面的命令 

spark-shell --master local[*]

         创建一个 RDD

sc.parallelize(1 to 10,3)

http://www.lryc.cn/news/185740.html

相关文章:

  • 动态内存管理函数(malloc,calloc,realloc,free)
  • 云表|都有生产管理模块,MES和ERP有什么不同,该如何选择
  • C语言 - 数组
  • Vue 中的插槽(Slot),有什么用,不同插槽的区别?
  • Linux登录自动执行脚本
  • 架构方法、模型、范式、治理
  • Linux 安全 - 内核提权
  • 数字三角形加强版题解(组合计数+快速幂+逆元)
  • MySQL:主从复制-基础复制(6)
  • 盒子模型的基础
  • Go复合类型之数组类型
  • rust闭包
  • 通过位运算,实现单字段标识多个状态位
  • ALSA pcm接口的概念解释
  • logging的基本使用教程
  • ds套dp——考虑位置转移or值域转移:CF1762F
  • stm32的GPIO寄存器操作以及GPIO外部中断,串口中断
  • 生成对抗网络入门案例
  • 多头注意力机制
  • Qt + FFmpeg 搭建 Windows 开发环境
  • [网鼎杯 2020 白虎组]PicDown python反弹shell proc/self目录的信息
  • SDL2绘制ffmpeg解析的mp4文件
  • 决策树C4.5算法的技术深度剖析、实战解读
  • LLMs Python解释器程序辅助语言模型(PAL)Program-aided language models (PAL)
  • 【12】c++设计模式——>单例模式练习(任务队列)
  • Python之函数、模块、包库
  • SQL创建与删除索引
  • 网络协议--链路层
  • HDLbits: Count clock
  • 【1day】用友移动管理系统任意文件上传漏洞学习