当前位置: 首页 > news >正文

Flume——sink连接Hive的参数配置(属性参数)

目录

  • 配置文件官网
  • 属性参数
  • 例子

配置文件官网

可以参考官网的说明

属性参数

属性名默认值说明
type无(必须指定)组件类型名称,必须是"hive"
hive.metastore无(必须指定)元数据仓库地址,例如:thrift://node3:9083
hive.database无(必须指定)数据库名称
hive.table无(必须指定)表名
hive.partition无(可选)逗号分割的分区值,标识写到哪个分区。可以包含逃逸字符。例如,如果表分区字段为(continent: string, country: string, time: string),则"Asia,India,2030-05-26-01-21"表示continent为Asia,country为India,time是2030-05-26-01-21
callTimeout10000Hive和HDFS的IO操作超时时间,例如openTxn、write、commit、abort等操作。单位为毫秒
batchSize15000一个Hive事务允许写的事件最大数量
roundValue1控制多长时间生成一个文件夹的时间的值
roundUnitminute控制多长时间生成一个文件夹的单位,可选值有:second、minute、hour

例子

# 定义Flume agent的名称
agent.name = a1# 定义agent中的sources(数据源)、channels(通道)和sinks(数据目的地)
a1.sources = r1
a1.channels = c1
a1.sinks = k1# 配置source,这里使用netcat source,用于从网络接收数据
a1.sources.r1.type = netcat
# 设置netcat source监听的IP地址和端口
a1.sources.r1.bind = 0.0.0.0
a1.sources.r1.port = 44444# 配置channel,这里使用memory channel,用于在内存中存储事件
a1.channels.c1.type = memory
# 设置memory channel的容量
a1.channels.c1.capacity = 10000
# 设置memory channel的事务容量
a1.channels.c1.transactionCapacity = 1000# 配置sink,这里使用hive sink,用于将数据写入Hive表
a1.sinks.k1.type = hive
# 设置Hive元数据存储的Thrift服务器地址
a1.sinks.k1.hive.metastore = thrift://node3:9083
# 设置要写入数据的Hive数据库名称
a1.sinks.k1.hive.database = my_database
# 设置要写入数据的Hive表名称
a1.sinks.k1.hive.table = my_table
# 设置分区值,用于将数据写入指定的Hive表分区
a1.sinks.k1.hive.partition = Asia,India,2030-05-26-01-21
# 设置Hive和HDFS的IO操作超时时间(毫秒)
a1.sinks.k1.callTimeout = 15000
# 设置一个Hive事务允许写的最大事件数量
a1.sinks.k1.batchSize = 20000
# 设置控制生成文件夹频率的值(这里设置为1,但具体含义取决于roundUnit)
a1.sinks.k1.roundValue = 1
# 设置控制生成文件夹频率的单位(这里设置为hour,即每小时生成一个文件夹)
a1.sinks.k1.roundUnit = hour# 将source绑定到channel,以便source接收到的事件可以通过channel传输
a1.sources.r1.channels = c1
# 将sink绑定到channel,以便channel中的事件可以被sink处理并写入Hive表
a1.sinks.k1.channel = c1
http://www.lryc.cn/news/498680.html

相关文章:

  • Netty面试内容整理-Netty 的应用场景
  • 波特图方法
  • 服务器数据恢复—硬盘掉线导致热备盘同步失败的RAID5阵列数据恢复案例
  • 在Ubuntu中运行和管理AppImage
  • 如何查看电脑的屏幕刷新率?
  • 浏览器数据存储方法深度剖析:LocalStorage、IndexedDB、Cookies、OPFS 与 WASM - SQLite
  • 面向金融场景的大模型 RAG 检索增强解决方案
  • 经典蓝牙(BT/EDR)蓝牙配对与连接
  • Flask: flask框架是如何实现非阻塞并发的
  • JAVA |日常开发中连接Oracle数据库详解
  • 头歌 进程管理之二(wait、exec、system的使用)
  • 详解日志格式配置:XML 与 Spring Boot 配置文件格式
  • JDK21新特性
  • SqlDataAdapter
  • AI赋能:构建安全可信的智能电子档案库
  • 分类预测 | PSO-PNN粒子群优化概率神经网络多特征分类预测
  • AcWing 3416. 时间显示
  • 【软考速通笔记】系统架构设计师⑲——专业英语
  • java注解(二):注解的解析以及应用场景、用注解和反射模拟junit框架代码演示
  • C# 命名空间(Namespace)
  • 几个Linux系统安装体验: centos7系统服务版
  • ViT学习笔记(一) 基本的原理和框架结构
  • fedora下Jetbrains系列IDE窗口中文乱码解决方法
  • nginx根据报文里字段转发至不同地址
  • 使用 html/css 实现 educoder 顶部导航栏的步骤和方法
  • EasyExcel导出列表
  • 【unity小技巧】分享vscode如何开启unity断点调试模式,并进行unity断点调试(2024年最新的方法,实测有效)
  • 【JavaScript】Object.keys() 和 Object.values() 的使用示例和相关的简单应用
  • SwiftUI 列表(或 Form)子项中的 Picker 引起导航无法跳转的原因及解决
  • 基于ZYNQ-7000系列的FPGA学习笔记8——呼吸灯