当前位置: 首页 > news >正文

flume 使用 exec 采集容器日志,转储磁盘

flume 使用 exec 采集容器日志,转储磁盘

在该场景下,docker 服务为superset,flume 的sources 选择 exec , sinks选择 file roll 。

任务配置

具体配置文件如下:

#simple.conf: A single-node Flume configuration# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1# Describe/configure the source
a1.sources.r1.type = exec
# exec source 监控命令是tail -f ,日志文件可随意指定,这里选择的是容器服务的日志文件
a1.sources.r1.command = tail -F /data/docker/containers/e511e3e4b3445efeb38fe822ac086dfc5ebb8bdc4a725dc6e2969ef2092c78ec/e511e3e4b3445efeb38fe822ac086dfc5ebb8bdc4a725dc6e2969ef2092c78ec-json.log# Describe the sink
a1.sinks.k1.type = file_roll
#指定文件转存储目录,可自建
a1.sinks.k1.sink.directory = /home/test/log
# one day roll once 一天滚动一次,为了防止转储日志文件过大,按天进行文件滚动
a1.sinks.k1.sink.rollInterval = 86400
#a1.sinks.k1.sink.pathManager = superset
# 定义日志文件后缀
a1.sinks.k1.sink.pathManager.extension = log
# 定义日志文件前缀
a1.sinks.k1.sink.pathManager.prefix = superset-# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

其中,关键配置已注释,其中file_roll sinks 中 type、sink.directory是必配,其他都是选配,可参考官网文档
https://flume.apache.org/releases/content/1.8.0/FlumeUserGuide.html
在这里插入图片描述

配置文件中exec source监测的日志文件,可以使用如下命令获取(前提是docker环境已部署,且有应用在运行)

docker inspect --format='{{.LogPath}}' <容器id>

任务执行

bin/flume-ng agent -c conf -f ./job/exec-memory-logger.conf -n a1//使用nohup &后台运行,不占用终端,但会生成nohup.out日志文件
nohup  bin/flume-ng agent -c conf -f ./job/exec-memory-logger.conf -n a1 &

到转储目录下查看,

在这里插入图片描述

superset- 是配置前缀,log是配置后缀,中间是时间戳(框架默认创建时间)

之所以有多个,是因为多次启停了flume agent任务。

实时性观察

tail -f 容器服务日志文件

同时tail -f 转储后的日志文件

发现两边有一个大概10S内的时差,容器服务日志产生后,大概5-6s才会在转储文件tail -f 到

经验总结

1 该方式转储日志文件基本能保证实时,时差大概5-6s(本机测试,未考虑网络时延,仅供参考)

2 flume 停止后在启动,会生成新的转储文件

3 exec source 不支持断点续传,停止后再启动,停止时间段数据不会处理

http://www.lryc.cn/news/433058.html

相关文章:

  • 459重复的子字符串
  • 【HarmonyOS NEXT】实现截图功能
  • 小皮面板webman ai项目本地启动教程
  • 从零实现诗词GPT大模型:实现多头自注意力
  • [rk3399 android11]关闭声卡
  • 项目实战 ---- 商用落地视频搜索系统(7)---预处理二次优化
  • 【干货分享】央企国企的群面、半结构面试复习方法和经验总结
  • 前端HTML基础笔记
  • 用三极管搭建简易电流源
  • MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源
  • Android Google Maps
  • Linux——进程概念
  • 【H2O2|全栈】关于HTML(1)认识HTML
  • Oracle(111) 如何使用RMAN备份数据库?
  • linux字符设备驱动程序
  • 【pyhton】python如何实现将word等文档中的文字转换成语音
  • Claude Enterprise推出计划
  • 【前端】CSS控制style样式失效
  • How can I load the openai api configuration through js in html?
  • Pipeline流水线通过git拉取Jenkinsfile报错 error: RPC failed; result=22, HTTP code = 404
  • 【与C++的邂逅】--- string容器使用
  • 1-18 平滑处理——高斯滤波 opencv树莓派4B 入门系列笔记
  • 小爱打工,你躺平!让「微信AI小助理」接管你的文件处理,一个字:爽!
  • 管理学习(一)马云《赢在中国》创业演讲整理
  • Opencv中的直方图(2)计算图像的直方图函数calcHist()的使用
  • Buzzer:一款针对eBPF的安全检测与模糊测试工具
  • 若依框架登录鉴权详解(动态路由)
  • 孤儿进程、僵尸进程、守护进程(精灵进程)
  • Centos9 网卡配置文件
  • ios免签H5