当前位置: 首页 > news >正文

本地spark3.5(不整合hive) 集成paimon0.9

spark官网下载集成hadoop的spark包:   spark-3.5.1-bin-hadoop3....
解压后 环境变量配置 SPARK_HOME
spark-defaults.conf 中增加一行配置(避免启动spark-sql报错hive元数据连不上): spark.sql.catalogImplementation=hive
打开paimon官网: https://paimon.apache.org/docs/master/spark/quick-start/
paimon-spark-3.5-0.9-SNAPSHOT.jar 下载放到 spark/jars 目录下
vi spark-sql-paimon.sh 内容如下(/tmp路径可替换为自己的家目录):spark-sql ... \--conf spark.sql.catalog.paimon=org.apache.paimon.spark.SparkCatalog \--conf spark.sql.catalog.paimon.warehouse=file:/tmp/paimon \--conf spark.sql.extensions=org.apache.paimon.spark.extensions.PaimonSparkSessionExtensions./sbin/start-all.sh启动spark
./bin/spark-sql-paimon.sh 启动支持paimon catalog的spark-sqlpaimon建表测试:
create table my_table (k int,v string
) tblproperties ('primary-key' = 'k'
);
INSERT INTO my_table VALUES (1, 'Hi'), (2, 'Hello');
INSERT INTO my_table VALUES (1, 'Hi'), (3, 'tom');
SELECT * FROM my_table;
-- 这套可替代spark on hive,配置简单,且spark服务重启后不会丢表. 
http://www.lryc.cn/news/355686.html

相关文章:

  • Linux IO模型深度解析与实战应用
  • 软件系统开发标准流程文档(Word原件)
  • 嵌入式进阶——外部中断(EXTI)
  • flinkcdc 3.0 源码学习之客户端flink-cdc-cli模块
  • 香橙派 AIpro开发体验:使用YOLOV8对USB摄像头画面进行目标检测
  • Python中正则表达式详解
  • vue使用EventBus进行跨组件通信
  • boot项目中定时任务quartz
  • 使用阿里云OSS实现视频上传功能
  • LOTO示波器软件新增导览功能
  • 【StructueEngineering】SYMBOL SCHEDULE
  • 简化跨网文件传输摆渡过程,降低IT人员工作量
  • 关于python中屏蔽输出
  • 螺旋矩阵(算法题)
  • ffmpeg-webrtc(metartc)给ffmpeg添加webrtc协议
  • C语言知识大纲
  • 【必会面试题】synchronized锁升级的过程
  • 设计模式——工厂三兄弟之简单工厂
  • 如何使用ChatGPT撰写短视频爆款文案
  • 申办风景园林设计乙级资质如何整理技术人员的专业培训证明
  • 类别型特征
  • java医院管理系统源码(springboot+vue+mysql)
  • vue2 面试题
  • 【JavaEE精炼宝库】多线程(3)线程安全 | synchronized
  • el-table-column两种方法处理特殊字段,插槽和函数
  • huggingface笔记: accelerate estimate-memory 命令
  • 李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
  • 超级好用的C++实用库之套接字
  • C++ | Leetcode C++题解之第108题将有序数组转换为二叉搜索树
  • 5月27日,每日信息差