当前位置: 首页 > news >正文

【Apache Paimon】-- 14 -- Spark 集成 Paimon 之 Filesystem Catalog 与 Hive Catalog 实践

目录

1. 背景介绍

2. 环境准备

2.1、技术栈说明

2.2、环境依赖

2.3、硬件与软件环境

2.4、主要工具清单

2.5、Maven 项目结构

2.6、maven pom.xml 依赖

3. Spark 与 Paimon Filesystem Catalog 集成

3.1、HDFS FileSystem catalog

3.1.1、代码内容

3.1.2、运行输出结果

3.1.2.1、Spark 运行日志

3.1.2.2、HDFS 文件目录

3.1.3、创建 hive 的 paimon 格式外部表并查询

3.2、S3 FileSystem catalog

3.2.1、代码内容

3.2.2、运行输出结果

3.2.2.1、Spark 运行日志

3.2.2.2、S3 存储目录

3.3、OSS FileSystem catalog

3.3.1、代码内容

3.3.2、运行输出结果

3.3.2.1、Spark 运行日志

3.3.2.2、OSS 存储目录

4. Spark 与 Paimon Hive Catalog 集成

4.1、代码内容

4.2、运行输出结果

4.2.1、Spark 运行日志

4.2.2、查询 Hive 表

5. 参考


1. 背景介绍

  • 为什么选择将 Spark 与 Paimon 集成,解决什么问题?
  • 文件系统 Catalog 和 Hive Catalog 的适用场景?

2. 环境准备

2.1、技术栈说明

  • Spark、Paimon 的版本选择及其兼容性说明
    • Paimon 0.8、0.9 支持版本:Spark 3.1
http://www.lryc.cn/news/518105.html

相关文章:

  • renben-openstack-使用操作
  • 开源CMS建站系统的安全优势有哪些?
  • 基于mybatis-plus历史背景下的多租户平台改造
  • 后台管理系统用户退出登录方案实现
  • C# 对象和类型(结构)
  • 利用AI优化SEO关键词提升网站排名的策略与技巧
  • “多维像素”多模态雷视融合技术构建自动驾驶超级感知能力|上海昱感微电子创始人蒋宏GADS演讲预告
  • 基于机器学习的故障诊断(入门向)
  • 【延伸学习】智能软开关优化配置对比算例【sop】
  • pytest 参数介绍
  • 源代码编译安装X11及相关库、vim,配置vim(1)
  • Node.js JXcore 打包教程
  • windows 下基于docker 部署 guacamole
  • 『SQLite』子查询可以这样用
  • 夯实前端基础之HTML篇
  • VVenC 编码器源码结构与接口函数介绍
  • 【C++习题】20. 两个数组的交集
  • 小R的蛋糕分享
  • 基于Arduino的FPV头部追踪相机系统
  • 使用 PyTorch 自定义数据集并划分训练、验证与测试集
  • VSCode 插件
  • Windows使用AutoHotKey解决鼠标键连击现象(解决鼠标连击、单击变双击的故障)
  • Linux 环境(Ubuntu)部署 Hadoop 环境
  • 如何在Windows 11 WSL2 Ubuntu 环境下安装和配置perf性能分析工具?
  • Docker运维高级容器技术知识点总结
  • react-quill 富文本组件编写和应用
  • LabVIEW轴承性能测试系统
  • 【《游戏编程模式》实战04】状态模式实现敌人AI
  • 借助免费GIS工具箱轻松实现las点云格式到3dtiles格式的转换
  • 科研绘图系列:R语言科研绘图之标记热图(heatmap)