当前位置: 首页 > news >正文

pyspark 安装记录

1、安装软件

1、python 3.10

2、hadoop-3.3.4   里面的winutils 要记得添加

3、java-17

4、spark-3.5.1-bin-hadoop3

python 安装 pyspark,Jupyter notebook

pip install pyspark
pip install jupyter notebook

2、添加环境变量 

  1. JAVA_HOME=C:\PySparkService\java-17
  2. HADOOP_HOME=C:\PySparkService\hadoop-3.3.4
  3. SPARK_HOME=C:\PySparkService\spark-3.5.1-bin-hadoop3
  4. %JAVA_HOME%\bin
  5. %HADOOP_HOME%\bin
  6. %SPARK_HOME%\bin

下面环境不配置会报错

PYSPARK_PYTHON=python

#jupyter notebook 启动 pyspark

# 自己安装 jupyter notebook 使用下面环境变量

PYSPARK_DRIVER_PYTHON=jupyter

<

http://www.lryc.cn/news/437706.html

相关文章:

  • 高度可定制的电竞鼠标,雷柏VT1 PRO MAX体验
  • 经验笔记:SOA(面向服务的架构)
  • triton之ttir学习
  • 如何在AWS账户上进行充值:一份详尽指南
  • (六十四)第 10 章 内部排序(静态链表的插入排序)
  • appium历史版本地址链接
  • TCPIP网络编程(尹圣雨)UDP 轮流收发消息(windows)
  • 【相机方案(2)】V4L2 支持相机图像直接进入GPU内存吗?DeepStream 确实可以将图像数据高效地放入GPU内存进行处理!
  • UEFI——PEI阶段
  • Nacos下载和启动
  • 怎么选择适合的服务器
  • 通义千问大模型Java调用,百炼
  • 新发现!一键管理所有远程会话的神器——1Remote
  • 华为 HCIP 认证费用和报名资格
  • Linux下载压缩包:tar.gz、zip、tar.bz2格式全攻略
  • 运行PaddleOCR报错:requests.exceptions.SSLError: HTTPSconnectionPool……
  • 基于STM32L431小熊派设计的智能花盆(微信小程序+腾讯云IOT)(223)
  • CentOS 入门必备基础知识
  • 快速排序
  • 钢琴灯有必要买很贵的吗?五款值得入手的护眼灯分享
  • C和指针:指针
  • paddle 分类网络
  • 计算机网络408考研 2022
  • 2023级JavaScript与jQuery
  • 【C++】————IO流
  • ESP8266连接到Blinker平台
  • qwen2 VL 多模态图文模型;图像、视频使用案例
  • ASPICE评估:汽车软件质量的守护神
  • 野生动物检测系统源码分享
  • 【Hot100】LeetCode—75. 颜色分类