当前位置：首页 > news >正文

基于Linux的Spark本地模式环境搭建实验指南

news 2025/7/5 14:41:14

一、实验目的

掌握Spark本地模式的安装与配置方法
验证Spark本地环境是否搭建成功
了解Spark基本操作和运行原理

二、实验环境准备

操作系统：Linux（推荐ubuntu）
Java环境：JDK 1.8或以上版本
内存：至少4GB（推荐8GB以上）
磁盘空间：至少2GB可用空间

三、实验步骤

1. 安装Java环境

# 检查Java是否已安装
java -version

注意：如果没有安装JDK请先学习

2. 下载Spark安装包

访问Spark官网下载页面：官网下载地址
选择最新稳定版本（如Spark 3.x），包类型选择"Pre-built for Apache Hadoop 2.7"或更高版本，具体如下：
在这里插入图片描述

3. 安装Spark

利用Finalshell工具将Spark安装包上传至Linux：
在这里插入图片描述

#进入安装包所在目录cd /home/wll/下载
# 解压安装包至指定文件夹/usr/local
sudo tar -zxf spark-3.5.6-bin-hadoop3.tgz -C /usr/local
#修改文件权限
sudo chown  -R wll /usr/local/spark-3.5.6-bin-hadoop3

4. 配置环境变量

编辑~/.bashrc文件：

vim ~/.bashrc

在~/.bashrc文件中添加如下代码：

export SPARK_HOME=/usr/local/spark-3.5.6-bin-hadoop3
export JAVA_HOME=/usr/local/jdk1.8.0_161
export SCALA_HOME=/usr/local/scala-2.11.8
export PATH=$PATH:${JAVA_HOME}/bin:${SCALA_HOME}/bin:${SPARK_HOME}/bin

使配置生效

source ~/.bashrc

5. 验证安装

# 检查Spark版本
spark-submit --version# 启动Spark shell（Scala）
spark-shell

在这里插入图片描述

打开Spark的Web UI页面：http://192.168.0.105:4040

出现以上界面，则基于Linux的Spark本地（Local）模式的环境搭建成功！
没有安装Hadoop！

查看全文

http://www.lryc.cn/news/580146.html

RabbitMQ 4.1.1初体验

Ubuntu Linux Cursor 安装与使用一

Web前端数据可视化：ECharts高效数据展示完全指南

【C#】入门

Linux三剑客：grep、sed、awk 详解以及find区别

大语言模型预训练数据——数据采样方法介绍以GPT3为例

基于Apache MINA SSHD配置及应用

CppCon 2018 学习:OOP is dead, long live Data-oriented design

ABP VNext + RediSearch：微服务级全文检索

PyCharm 安装使用教程

Rust异步爬虫实现与优化

全星 QMS：制造业全面质量管理的数字化全能平台

鸿蒙系统（HarmonyOS）应用开发之手势锁屏密码锁（PatternLock）

Jenkins-Publish HTML reports插件

接口测试之postman

ZigBee通信技术全解析：从协议栈到底层实现，全方位解读物联网核心无线技术

区块链技术核心组件及应用架构的全面解析

7.4_面试_JAVA_

【PyTorch】PyTorch预训练模型缓存位置迁移，也可拓展应用于其他文件的迁移

基于PHP+MySQL实现（Web）英语学习与测试平台

408第三季part2 - 计算机网络 - 计算机网络基本概念

金融平衡术：创新与合规的突围之路

Spark从入门到实战：安装与使用全攻略

使用 DigitalPlat 免费搭配 Cloudflare Tunnel 实现飞牛系统、服务及 SSH 内网穿透教程

Java SE--方法的使用

Kotlin中优雅的一行行读取文本文件

缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级

【笔记】PyCharm 2025.2 EAP 创建 Poetry 和 Hatch 环境的踩坑实录与反馈

三体融合实战：Django+讯飞星火+Colossal-AI的企业级AI系统架构

Android WebView 性能优化指南