当前位置: 首页 > news >正文

windows安装spark

在 Windows 上安装 Spark 并进行配置需要一些步骤,包括安装必要的软件和配置环境变量。以下是详细的步骤指南:

步骤一:安装 Java

  1. 下载和安装 Java Development Kit (JDK)

    • 到 Oracle JDK 下载页面 或 OpenJDK 下载页面 下载适合你系统的 JDK。
    • 安装 JDK,记住安装路径。
  2. 配置环境变量

    • 右键点击“此电脑”或“计算机”,选择“属性”。

    • 点击“高级系统设置”。

    • 点击“环境变量”。

    • 在“系统变量”下,点击“新建”,然后添加以下内容:

      • 变量名:JAVA_HOME
      • 变量值:JDK 安装路径(例如:C:\Program Files\Java\jdk-11.0.10
    • 找到 Path 变量,选择它并点击“编辑”。在变量值的末尾添加以下内容:%JAVA_HOME%\bin

步骤二:安装 Hadoop

  1. 下载 Hadoop 二进制文件

    • 到 Hadoop 官方网站 下载最新的二进制发行版,例如 hadoop-3.3.1.tar.gz
    • 解压缩文件到你的本地目录,例如 C:\hadoop-3.3.1
  2. 配置 Hadoop 环境变量

    • 回到“环境变量”窗口,点击“新建”,然后添加以下内容:

      • 变量名:HADOOP_HOME
      • 变量值:Hadoop 安装路径(例如:C:\hadoop-3.3.1
    • 编辑 Path 变量,在变量值的末尾添加以下内容:%HADOOP_HOME%\bin

  3. 配置 Hadoop Winutils

    • 下载 Hadoop 的 winutils.exe 文件,可以从 GitHub 仓库 找到对应版本。
    • winutils.exe 放到 C:\hadoop-3.3.1\bin 目录下。

步骤三:安装 Apache Spark

  1. 下载 Spark

    • 到 Spark 官方网站 下载预编译的 Spark 版本,例如 spark-3.1.2-bin-hadoop3.2.tgz
    • 解压缩文件到你的本地目录,例如 C:\spark-3.1.2-bin-hadoop3.2
  2. 配置 Spark 环境变量

    • 回到“环境变量”窗口,点击“新建”,然后添加以下内容:

      • 变量名:SPARK_HOME
      • 变量值:Spark 安装路径(例如:C:\spark-3.1.2-bin-hadoop3.2
    • 编辑 Path 变量,在变量值的末尾添加以下内容:%SPARK_HOME%\bin

步骤四:验证安装

  1. 打开命令提示符

    • Win + R 打开“运行”窗口,输入 cmd 并按 Enter
  2. 验证 Java 安装

    • 在命令提示符中输入:java -version
    • 应该显示已安装的 Java 版本。
  3. 验证 Hadoop 安装

    • 在命令提示符中输入:hadoop version
    • 应该显示已安装的 Hadoop 版本。
  4. 验证 Spark 安装

    • 在命令提示符中输入:spark-shell
    • 应该启动 Spark Shell 并显示 Spark 版本和其他信息。

步骤五:运行 Spark 示例

  1. 在命令提示符中
    • 进入 Spark 安装目录,例如:cd C:\spark-3.1.2-bin-hadoop3.2
    • 运行 Spark 示例:bin\spark-submit --class org.apache.spark.examples.SparkPi examples\jars\spark-examples_2.12-3.1.2.jar 10
    • 这将运行 Spark Pi 示例并输出结果。

通过以上步骤,你已经在 Windows 系统上成功安装并配置了 Spark,可以开始进行分布式数据处理和分析任务。如果在安装过程中遇到问题,请确保每一步的环境变量配置和软件版本匹配。

http://www.lryc.cn/news/379152.html

相关文章:

  • 【信息学奥赛】CSP-J/S初赛03 计算机网络与编程语言分类
  • python20 函数的定及调用
  • 【Android WebView】WebView基础
  • Python酷库之旅-第三方库openpyxl(03)
  • 电脑丢失dll文件一键修复的方法有哪些?分析dll文件修复的多种策略
  • 小程序项目业务逻辑回忆4
  • LeetCode 16.最接近的三数之和(C++)
  • JSON.parse 解析NaN, Infinity, -Infinity失败
  • 【计算机】我不允许还有人不知道数据库是什么
  • 制作WIFI二维码,实现一键扫描连接WIFI
  • 数据结构-图的基本概念
  • 【HarmonyOS NEXT 】鸿蒙generateBarcode (码图生成)
  • python测试工程师 之 unittest框架总结
  • 微服务中的相关概念
  • 常见的设计模式
  • Camtasia2024中文版最新电脑录屏剪辑神器!
  • 【性能优化】表分区实践最佳案例
  • 力扣SQL50 项目员工 I ROUND AVG
  • nuscenes 数据集学习笔记
  • 在Windows上用MinGW编译OpenCV项目运行全流程
  • 用Vite基于Vue3+ts+DataV+ECharts开发数据可视化大屏,即能快速开发又能保证屏幕适配
  • 大二学生眼中的Netty?基于Netty实现内网穿透!
  • JavaStringBuffer与StringBuilder
  • 云徙科技助力竹叶青实现用户精细化运营,拉动全渠道销售额增长
  • 深度揭秘:深度学习框架下的神经网络架构进化
  • MySQL的DML语句
  • Wireshark的基本用法以及注意事项
  • 集团门户网站的设计
  • Tomcat基础详解
  • 【Python爬虫】爬取名人名言页面并进行简单的数据清洗(入门级)