当前位置: 首页 > news >正文

Spark环境搭建-Local

目录

Local下的角色分布:

Anaconda On Linux 安装 (单台服务器)

1.下载+安装

2.国内源

下载Spark安装包

1.下载

2.解压

3.环境变量

测试

监控


Local下的角色分布:

资源管理:
        Master:Local进程本身
        Worker:Local进程本身
任务执行:
        Driver:Local进程本身
        Executor:不存在,没有独立的Executor角色, 由Local进程(也就是Driver)内的线程提供计算能力

Anaconda On Linux 安装 (单台服务器)

1.下载+安装

在https://www.anaconda.com/download/success中下载安装包并上传到linux服务器上

我的对应的是python3.12

使用命令

sh ./Anaconda3-2024.06-1-Linux-x86_64.sh

输入yes后就安装完成了

安装完成后,,退出SecureCRT重新进来,看到开头有Base表面安装好了

base是默认的虚拟环境

2.国内源

在/root下新建文件.bashrc,加入以下内容

channels:- defaults
show_channel_urls: true
default_channels:- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudmsys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudbioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudmenpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudpytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloudsimpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

下载Spark安装包

1.下载

在https://spark.apache.org/downloads.html中下载spark并把压缩包上传到linux服务器上。

我将其放在/export/server目录下

2.解压

使用命令

tar -zxvf spark-3.5.2-bin-hadoop3.tgz -C /export/server

将spark目录解压到/export/server目录下

3.环境变量

配置Spark由如下5个环境变量需要设置

  • SPARK_HOME: 表示Spark安装路径在哪里
  • PYSPARK_PYTHON: 表示Spark想运行Python程序, 那么去哪里找python执行器
  • JAVA_HOME: 告知Spark Java在哪里
  • HADOOP_CONF_DIR: 告知Spark Hadoop的配置文件在哪里
  • HADOOP_HOME: 告知Spark  Hadoop安装在哪里

PYSPARK_PYTHON在Anaconda目录下的/bin/python3.12

这5个环境变量 都需要配置在: /etc/profile中​

PYSPARK_PYTHON和 JAVA_HOME 需要同样配置在: /root/.bashrc

测试

转到$SPARK_HOME/bin目录,输入./pyspark,当出现一下界面说明启动成功。

 执行一个pyspark代码体验一下

 

监控

我们可以在标记的地方看到一个地址,这个地址可以查看Driver的运行情况。

 输入地址可以看到这样的界面

在这里可以看到里面记录了一个任务就是刚刚进行数组元素加一的任务。

http://www.lryc.cn/news/429654.html

相关文章:

  • 使用FModel提取黑神话悟空的资产
  • MYSQL定时任务使用手册
  • SAP 预扣税配置步骤文档【Withholding Tax]
  • Ubuntu ssh配置
  • Spring Boot OAuth2.0应用
  • Java | Leetcode Java题解之第363题矩形区域不超过K的最大数值和
  • AI作画提示词(Prompts)工程:技巧与最佳实践
  • leetcode滑动窗口问题
  • QT 控件使用案例
  • 【MySQL 10】表的内外连接 (带思维导图)
  • 【C语言】:与文件通信
  • HTTPS通讯全过程
  • 建筑物规则化(实现) --- 特征边分组、重构、直角化
  • pytorch的优化
  • React 入门第一天:从Vue到React的初体验
  • Golang | Leetcode Golang题解之第357题统计各位数字都不同的数字个数
  • 【Linux】 gdb-调试器初入门(简单版使用)
  • Spring 的事务支持
  • 基于STM32开发的智能家居照明控制系统
  • 程序员的底层思维~张建飞
  • 美股收涨,半导体板块领涨;苹果iPhone出货预测上调
  • [学习笔记]在不同项目中切换Node.js版本
  • SOL项目开发代币DApp的基本要求、模式创建与海外宣发策略
  • 如何在 FastReport .NET 中构建和安装 Postgres 插件
  • JVM指令重排序
  • 改造字典关键字:
  • Neo4j 图数据库入门
  • linux 磁盘满了,程序运行失败,如何处理?df -h
  • Python编码系列—前端后浪:Python前后端分离开发实战指南
  • Docker学习之路【五】了解数据卷