当前位置: 首页 > news >正文

flume系列之:出现数据堆积时临时增大sink端消费能力

flume系列之:出现数据堆积时临时增大sink端消费能力

  • 一、背景
  • 二、增大sink端消费能力

flume系列之:flume生产环境sink重要参数理解

一、背景

  • flume出现数据堆积,消费的数据持续堆积在channel中
  • 参数org_apache_flume_channel_channel1_channelfillpercentage的值大于0,并且持续增长,表明source端消费的数据,sink端无法及时同步到hdfs上
  • 现在需要加快sink端消费数据的能力,从而保证数据快速消化完

二、增大sink端消费能力

适当调大下面参数的值:

  • sinks.sink1.hdfs.maxOpenFiles = 9000

  • 设置HDFS Sink插件同时打开的最大文件数。系统的磁盘和内存资源充足,并且需要同时写入大量的文件,可以适当增大该参数的值。系统资源有限或写入的文件较少,可以减小该参数的值。

  • sinks.sink1.hdfs.threadsPoolSize = 500

  • 设置HDFS Sink插件的线程池大小。该参数的值决定了可以并行处理的任务数。系统的CPU核心数较多,并且

http://www.lryc.cn/news/444404.html

相关文章:

  • SQL Server全方位指南:从入门到高级详解
  • 【JavaSE】IO模型
  • 手术缝合线合格品检测项目众多 线径又是其重要一环!
  • STM32 单片机最小系统全解析
  • 深度解析ElasticSearch:构建高效搜索与分析的基石原创
  • 【Python常用模块】_PyMySQL模块详解
  • 【算法思想·二叉树】最近公共祖先问题
  • 如何合并pdf文件,四款软件,三步搞定!
  • 仪表放大器AD620
  • 【Qt网络编程】Tcp多线程并发服务器和客户端通信
  • SkyWalking 简介
  • 语音合成(自然、非自然)
  • redis简单使用与安装
  • 封装 WBXpopup 组件
  • 【OJ刷题】双指针问题6
  • 详解:Tensorflow、Pytorch、Keras(搭建自己的深度学习网络)
  • 【CSS in Depth 2 精译_035】5.5 Grid 网格布局中的子网格布局(全新内容)
  • Java是怎么处理死锁的
  • Effective Java 学习笔记 方法签名设计
  • 毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
  • 本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌
  • 图像压缩编码(4)--H.26x系列视频压缩编码_2
  • JS渲染锻炼输入表单
  • proteus仿真学习(1)
  • 决策树+随机森林模型实现足球大小球让球预测软件
  • 31省市农业地图大数据
  • http请求包含什么
  • 【基础算法总结】模拟篇
  • 《深度学习》PyTorch 手写数字识别 案例解析及实现 <下>
  • 【笔记】材料分析测试:晶体学