当前位置: 首页 > news >正文

数据湖技术之Iceberg-03 Iceberg整合Flink 实时写入与增量读取

文章目录

  • 数据湖技术
    • 数据湖技术之Iceberg
      • Flink 与 Iceberg 整合
        • 1. DataFrame API 操作 Iceberg
          • DataStream API实时写入Iceberg表
          • DataStream API 批量/实时读取 Iceberg 表
          • 指定基于快照实时增量读取数据
          • 合并data files
        • 2. SQL API 操作 Iceberg
          • SQL API 创建 Iceberg 表并写入数据
          • SQL API 批量查询 Iceberg 表数据
          • SQL API 实时查询 Iceberg 表数据
          • SQL API 指定基于快照实时增量读取数据
        • 3. SQL API读取kafka数据实时写入Iceberg表
      • Iceberg 与 Hudi 对比
        • 1. 共同点
        • 2. 不同点

数据湖技术

数据湖技术之Iceberg

Flink 与 Iceberg 整合

  • Flink 版本:1.14.4
  • iceberg:0.13.2
  • Maven依赖:
<!-- Flink与Iceberg整合的依赖包-->
<dependency><groupId>org.apache.iceberg</groupId><artifactId>iceberg-flink-runtime-1.14</artifactId><version>${iceberg.version}</version>
</dependency>
<!-- 开发Flink程序依赖包-->
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-java</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-streaming-java_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-clients_2.12</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-streaming-scala_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<!-- Flink Kafka连接器依赖包-->
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-connector-kafka_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-connector-base</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-csv</artifactId><version>${flink.version}</version>
</dependency>
<!-- 读取 hdfs 文件需要 jar 包-->
<dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-client</artifactId><version>${hadoop.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-common</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-api-java</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-api-java-bridge_${scala.version}</artifactId><version>${flink.version}</version>
</dependency>
<dependency><groupId>org.apache.flink</groupId><artifactId>flink-table-planner_${scala.version}</artifactId><version>${flink.version}</version>
http://www.lryc.cn/news/582949.html

相关文章:

  • 【HarmonyOS】鸿蒙端云一体化开发入门详解 (一)
  • 深度剖析 Linux ip neigh:邻居表项的查看与添加实践
  • RabbitMQ第二章(RocketMQ的五大工作模式)
  • 二进制安全-汇编语言-04-第一个程序
  • 为什么elementui的<el-table-column label=“名称“ prop=“name“ label不用写成:label
  • Docker快速部署Hive服务
  • C++ 遍历可变参数的几种方法
  • 零基础|宝塔面板|frp内网穿透|esp32cam远程访问|微信小程序
  • 链表算法之【移除链表元素】
  • 【深度学习新浪潮】什么是上下文长度?
  • C++异步编程入门
  • 猿人学js逆向比赛第一届第十五题
  • Java面试基础:概念
  • 部署并运行Vim/Vmamba在ImageNet上的训练与测试
  • JavaScript之数组方法详解
  • (C++)list列表相关基础用法(C++教程)(STL库基础教程)
  • HTTP/3.x协议详解:基于QUIC的下一代Web传输协议
  • 音频被动降噪技术
  • nng库使用
  • Android Handler机制与底层原理详解
  • Java 阻塞队列:7种类型全解析
  • 华为eNSP防火墙实验(包含详细步骤)
  • AR 双缝干涉实验亮相:创新科技实验范式,开拓 AR 技术新局​
  • Kafka多组消费:同一Topic,不同Group ID
  • 如何用Python编程计算权重?
  • 常见的网络攻击方式及防御措施
  • 分布式接口幂等性的演进和最佳实践,含springBoot 实现(Java版本)
  • 【c++学习记录】状态模式,实现一个登陆功能
  • 【ES实战】ES客户端线程量分析
  • 从 .proto 到 Python:使用 Protocol Buffers 的完整实践指南