当前位置: 首页 > news >正文

windows idea本地执行spark sql避坑

本地安装了IDEA,并配置好了相关POM,可以在本机使用sparkSession连接数据,并在数据库执行sql,在idea展示执行结果。

但是,如果将数据的查询结果建立到spark中,再展示,就会报错

Error while running command to get file permissions : java.io.IOException: (null) entry in command string: null ls -F D:\tmp\hive

    println(sql)//sql = s"(select * from mtl_system_items_b where rownum < 10) b"dbConf += ("dbtable" -> sql)val df2 = spark.read.format("jdbc").options(dbConf).load()df2.showdf2.createOrReplaceTempView("boms")print("show results")spark.sql("select * from boms").show()

在df2.show的时候,是可以正常展示数据的

但是使用createOrReplaceTempView后,使用spark.sql("").show(),展示数据就会报错。

原因:

经过网上各种查询,有个靠谱的解释是本机没有配置hadoop,导致idea在执行的时候报错

解决方法:

        1.找同事要了hadoop文件(也可以在网上下载)

        2.将hadoop文件解压缩,放到一个位置,哪里都好,我是放到了idea的文件夹下

        3. 修改环境变量,建立HADOOP_HOME,并且在path配置文件下吧HADOOP_HOME文件加进去

        4. 修改hadoop下的jdk文件路径,修改的时候注意跟进参考文档中修改,否则执行会报错

        5. 重启电脑,必须重启电脑

        6. 在idea执行程序,还是会报错,但是错误变了,网上的解释是,缺少文件winutils.exe,从以下地址下载,下载完成后,放到hadoop/bin下面

https://raw.githubusercontent.com/steveloughran/winutils/master/hadoop-2.6.0/bin/winutils.exe

        7. 重启idea,执行代码,还是报错,有点头晕,一狠心,把D:tmp文件夹给删掉了,在执行idea的程序,正常输出了

                

具体操作参考:

hadoop-2.7.3 在windows环境下安装(无需Cygwin)-CSDN博客

winutils.exe的参考文档

spark代码连接hive_本地spark连接hive相关问题总结-CSDN博客

http://www.lryc.cn/news/216467.html

相关文章:

  • 在一个循环链队中只有尾指针(记为rear,结点结构为数据域data,指针域next),请给出这种队列的入队和出队操作实现过程
  • 智能客服系统应用什么技术?
  • 亚马逊、美客多卖家测评:如何建立养号团队实现运营化式测评?
  • 苹果IOS系统webglcontextlost问题-解决方案
  • 供应链ERP之合同:创建、修订与模板
  • MySQL第二讲·表的创建与修改
  • springboot的循环依赖问题描述及解决方案
  • 当科技遇上神器:用Streamlit定制AI可视化问答界面
  • 毛泽东思想和中国特色社会主义理论概论平时作业四
  • 微信怎么设置自动通过好友申请?
  • 亲测解决Pytorch TypeError: object of type ‘numpy.int64‘ has no len()
  • 前端模拟实现可编辑的表格table插件
  • PerfectPixel 插件,前端页面显示优化工具
  • mysql迁移data目录(Linux-Centos)
  • linux-等保测评
  • 一、React基础知识
  • RocketMQ入门示例-生产者
  • 2023面试知识点三
  • 【hcie-cloud】【1】华为云Stack解决方案介绍、华为文档获取方式 【上】
  • JS-类型转换
  • centos7计划任务crontab
  • pycharm 断点调试python Flask
  • Jtti:redis出现太多连接错误怎么解决
  • iOS实现弹簧放大动画
  • ③ 软件工程CMM、CMMI模型【软考中级-软件设计师 考点】
  • JumpServer开源堡垒机与万里安全数据库完成兼容性认证
  • 蓝桥杯每日一题2023.10.31
  • 【兔子王赠书第5期】ChatGPT速学通:文案写作+PPT制作+数据分析+知识学习与变现
  • selenium爬虫——以爬取澎湃新闻某搜索结果为例
  • 基于GEE云平台一种快速修复Landsat影像条带色差的方法