当前位置：首页 > news >正文

flume系列之：出现数据堆积时临时增大sink端消费能力

news 2025/7/22 4:56:01

flume系列之：出现数据堆积时临时增大sink端消费能力

一、背景
二、增大sink端消费能力

flume系列之：flume生产环境sink重要参数理解

一、背景

flume出现数据堆积，消费的数据持续堆积在channel中
参数org_apache_flume_channel_channel1_channelfillpercentage的值大于0，并且持续增长，表明source端消费的数据，sink端无法及时同步到hdfs上
现在需要加快sink端消费数据的能力，从而保证数据快速消化完

二、增大sink端消费能力

适当调大下面参数的值：

sinks.sink1.hdfs.maxOpenFiles = 9000
设置HDFS Sink插件同时打开的最大文件数。系统的磁盘和内存资源充足，并且需要同时写入大量的文件，可以适当增大该参数的值。系统资源有限或写入的文件较少，可以减小该参数的值。
sinks.sink1.hdfs.threadsPoolSize = 500
设置HDFS Sink插件的线程池大小。该参数的值决定了可以并行处理的任务数。系统的CPU核心数较多，并且

http://www.lryc.cn/news/444404.html

相关文章：

SQL Server全方位指南：从入门到高级详解

【JavaSE】IO模型

手术缝合线合格品检测项目众多线径又是其重要一环！

STM32 单片机最小系统全解析

深度解析ElasticSearch：构建高效搜索与分析的基石原创

【Python常用模块】_PyMySQL模块详解

【算法思想·二叉树】最近公共祖先问题

如何合并pdf文件，四款软件，三步搞定！

仪表放大器AD620

【Qt网络编程】Tcp多线程并发服务器和客户端通信

SkyWalking 简介

语音合成(自然、非自然)

redis简单使用与安装

封装 WBXpopup 组件

【OJ刷题】双指针问题6

详解：Tensorflow、Pytorch、Keras（搭建自己的深度学习网络）

【CSS in Depth 2 精译_035】5.5 Grid 网格布局中的子网格布局（全新内容）

Java是怎么处理死锁的

Effective Java 学习笔记方法签名设计

毛利超70%、超70＋智驾客户，这家AI数据训练服务商刚刚止亏

本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌

图像压缩编码（4）--H.26x系列视频压缩编码_2

JS渲染锻炼输入表单

proteus仿真学习（1）

决策树+随机森林模型实现足球大小球让球预测软件

31省市农业地图大数据

http请求包含什么

【基础算法总结】模拟篇

《深度学习》PyTorch 手写数字识别案例解析及实现＜下＞

【笔记】材料分析测试：晶体学