当前位置: 首页 > news >正文

spark,读取和写入同一张表问题

读取a表,写入a表

1.写入的是分区表,不报错

2.读取上来之后,创建为临时视图temp,然后先写入a表,再使用temp,就会报错

解决办法:可以先使用temp,再写入a表

3.写入的不是分区表,会报错

解决办法:先把数据收集到Driver,创建临时视图,再写入a表

4.万能解决办法:先把数据收集到Driver,创建临时视图,再写入a表

Dataset<Row> dataset = spark.sql(get_new_id_Sql());StructType schema = dataset.schema();List<Row> rows = dataset.collectAsList();spark.createDataFrame(rows, schema).createOrReplaceTempView("all_data");
insert overwrite table ods.a
select * from all_data

可能的原因:spark是移动数据不如移动计算,所以数据的路径还是a表,如果收集到Driver,路径就不是a表了

http://www.lryc.cn/news/522300.html

相关文章:

  • iOS - TLS(线程本地存储)
  • node.js项目依赖关系分析工具 Depazer 的使用
  • QT 如何禁止QComboBox鼠标滚轮
  • 理解CPU负载与使用率
  • 浅谈计算机网络01 | SDN数据平面
  • 《Java开发手册》核心内容
  • 采用海豚调度器+Doris开发数仓保姆级教程(满满是踩坑干货细节,持续更新)
  • 通过将模型权重的矩阵表示为低秩矩阵,可以减少需要调整的参数数量,通俗易懂的解释,不懂你爬网线打我
  • Java并发编程——线程池(基础,使用,拒绝策略,命名,提交方式,状态)
  • DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition 中的空洞自注意力机制
  • 二十三种设计模式-适配器模式
  • 复用类(2):代理、结合使用组合和继承
  • 浅谈云计算07 | 云安全机制
  • 【机器学习】零售行业的智慧升级:机器学习驱动的精准营销与库存管理
  • 深入理解 Entity、VO、QO、DTO 的区别及其在 MVC 架构中的应用
  • vue集成高德地图API实现坐标拾取功能
  • Spring Boot Actuator 详细介绍
  • 联通用户管理系统(一)
  • go chan底层分析
  • idea上git log面板的使用
  • WOA-Transformer鲸鱼算法优化编码器时间序列预测(Matlab实现)
  • dock 制作 python环境
  • 2025第3周 | json-server的基本使用
  • Autodl转发端口,在本地机器上运行Autodl服务器中的ipynb文件
  • flutter Get GetMiddleware 中间件不起作用问题
  • RabbitMQ(三)
  • 【Python】Python之locust压测教程+从0到1demo:基础轻量级压测实战(1)
  • 【JavaScript】基础内容,HTML如何引用JavaScript, JS 常用的数据类型
  • vue使用自动化导入api插件unplugin-auto-import,避免频繁手动导入
  • 在 C# 中的Lambda 表达式