当前位置: 首页 > news >正文

基于Linux的Spark本地模式环境搭建实验指南

一、实验目的

  1. 掌握Spark本地模式的安装与配置方法
  2. 验证Spark本地环境是否搭建成功
  3. 了解Spark基本操作和运行原理

二、实验环境准备

  • 操作系统:Linux(推荐ubuntu)
  • Java环境:JDK 1.8或以上版本
  • 内存:至少4GB(推荐8GB以上)
  • 磁盘空间:至少2GB可用空间

三、实验步骤

1. 安装Java环境

# 检查Java是否已安装
java -version

注意:如果没有安装JDK请先学习

2. 下载Spark安装包

访问Spark官网下载页面:官网下载地址
选择最新稳定版本(如Spark 3.x),包类型选择"Pre-built for Apache Hadoop 2.7"或更高版本,具体如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3. 安装Spark

利用Finalshell工具将Spark安装包上传至Linux:
在这里插入图片描述

#进入安装包所在目录cd /home/wll/下载
# 解压安装包至指定文件夹/usr/local
sudo tar -zxf spark-3.5.6-bin-hadoop3.tgz -C /usr/local
#修改文件权限
sudo chown  -R wll /usr/local/spark-3.5.6-bin-hadoop3

4. 配置环境变量

编辑~/.bashrc文件:

vim ~/.bashrc

在~/.bashrc文件中添加如下代码:

export SPARK_HOME=/usr/local/spark-3.5.6-bin-hadoop3
export JAVA_HOME=/usr/local/jdk1.8.0_161
export SCALA_HOME=/usr/local/scala-2.11.8
export PATH=$PATH:${JAVA_HOME}/bin:${SCALA_HOME}/bin:${SPARK_HOME}/bin

使配置生效

source ~/.bashrc

5. 验证安装

# 检查Spark版本
spark-submit --version# 启动Spark shell(Scala)
spark-shell

在这里插入图片描述
在这里插入图片描述
打开Spark的Web UI页面:http://192.168.0.105:4040
在这里插入图片描述
在这里插入图片描述

出现以上界面,则基于Linux的Spark本地(Local)模式的环境搭建成功!
没有安装Hadoop!

http://www.lryc.cn/news/580146.html

相关文章:

  • RabbitMQ 4.1.1初体验
  • Ubuntu Linux Cursor 安装与使用一
  • Web前端数据可视化:ECharts高效数据展示完全指南
  • 【C#】入门
  • Linux三剑客:grep、sed、awk 详解以及find区别
  • 大语言模型预训练数据——数据采样方法介绍以GPT3为例
  • 基于Apache MINA SSHD配置及应用
  • CppCon 2018 学习:OOP is dead, long live Data-oriented design
  • ABP VNext + RediSearch:微服务级全文检索
  • PyCharm 安装使用教程
  • Rust异步爬虫实现与优化
  • 全星 QMS:制造业全面质量管理的数字化全能平台
  • 鸿蒙系统(HarmonyOS)应用开发之手势锁屏密码锁(PatternLock)
  • Jenkins-Publish HTML reports插件
  • 接口测试之postman
  • ZigBee通信技术全解析:从协议栈到底层实现,全方位解读物联网核心无线技术
  • 区块链技术核心组件及应用架构的全面解析
  • 7.4_面试_JAVA_
  • 【PyTorch】PyTorch预训练模型缓存位置迁移,也可拓展应用于其他文件的迁移
  • 基于PHP+MySQL实现(Web)英语学习与测试平台
  • 408第三季part2 - 计算机网络 - 计算机网络基本概念
  • 金融平衡术:创新与合规的突围之路
  • Spark从入门到实战:安装与使用全攻略
  • 使用 DigitalPlat 免费搭配 Cloudflare Tunnel 实现飞牛系统、服务及 SSH 内网穿透教程
  • Java SE--方法的使用
  • Kotlin中优雅的一行行读取文本文件
  • 缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级
  • 【笔记】PyCharm 2025.2 EAP 创建 Poetry 和 Hatch 环境的踩坑实录与反馈
  • 三体融合实战:Django+讯飞星火+Colossal-AI的企业级AI系统架构
  • Android WebView 性能优化指南