当前位置: 首页 > news >正文

生产环境中:Flume 与 Prometheus 集成

        在生产环境中,将 Apache Flume 与 Prometheus 集成的过程,需要借助 JMX Exporter 或 HTTP Exporter 来将 Flume 的监控数据转换为 Prometheus 格式。以下是详细的实现方法,连同原理和原因进行逐步解释,让刚接触的初学者也能完成集成。


原理和概念

  1. Flume 的监控数据来源
    Flume 会暴露监控指标(如事件接收速率、Channel 容量等):

    • 通过 JMX(Java Management Extensions):用于 Java 应用的标准监控接口。
    • 通过 HTTP:通过 REST API 提供 JSON 格式的监控数据。
  2. Prometheus 的数据抓取方式
    Prometheus 定期从指定目标抓取监控指标。这些目标需要返回 Prometheus 可读的 Metrics 格式数据key value 格式)。

  3. JMX Exporter 和 HTTP Exporter 的作用

    • JMX Exporter:将 Flume 的 JMX 数据转换为 Prometheus 格式。
    • HTTP Exporter:将 Flume 的 HTTP 数据转换为 Prometheus 格式。

        通过上述工具,可以让 Flume 的监控数据被 Prometheus 定期抓取,从而实现可视化和报警功能。


实现步骤:使用 JMX Exporter 集成

1. 下载并配置 JMX Exporter

  1. 下载 JMX Exporter
    到 Prometheus JMX Exporter 的 GitHub 页面,下载 JAR 包:

    wget https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/0.17.2/jmx_prometheus_javaagent-0.17.2.jar
    
  2. 创建配置文件
    创建一个 YAML 文件(如 jmx_config.yml),定义需要监控的指标。示例内容如下:

    rules:- pattern: ".*"name: "flume_$1"type: "GAUGE"labels:component: "$2"
    

    原因

    • rules 定义了哪些 JMX 指标会被暴露。
    • pattern 通过正则表达式匹配 JMX 属性。
    • name 定义 Prometheus 的指标名称。

2. 修改 Flume 启动脚本

为了让 Flume 支持 JMX Exporter,需要在其 JVM 启动参数中添加 JMX Exporter 的代理配置。

  1. 找到 Flume 启动脚本
    通常位于$FLUME_HOME/bin/flume-ng. 

  2. 修改启动参数
    编辑 flume-ng,找到包含 JAVA_OPTS 的部分,加入以下内容:

    JAVA_OPTS="$JAVA_OPTS -javaagent:/path/to/jmx_prometheus_javaagent-0.17.2.jar=12345:/path/to/jmx_config.yml"
    

    解释(按照自己的实际需要修改)

    • -javaagent:指定加载的代理 JAR。
    • 12345:JMX Exporter 监听的端口。
    • /path/to/jmx_config.yml:JMX Exporter 的配置文件路径。
  3. 重启 Flume

    bin/flume-ng agent -n <agent-name> -c conf -f <config-file>
    

3. 配置 Prometheus

  1. 修改 Prometheus 配置文件prometheus.yml):
    添加以下内容,将 JMX Exporter 的地址作为抓取目标:

    scrape_configs:- job_name: 'flume'static_configs:- targets: ['<flume-host>:12345']
    

    解释

    • job_name:为监控任务命名。
    • targets:Flume 所在机器的 IP 和 JMX Exporter 的端口。
  2. 重启 Prometheus

    systemctl restart prometheus
    
  3. 验证
    在 Prometheus 的 Web 界面(默认 http://<prometheus-host>:9090 )中搜索 flume_*,可以看到 Flume 的监控数据。


实现步骤:使用 HTTP Exporter 集成

如果不想使用 JMX,Flume 自带的 HTTP 监控端口也可以用来集成 Prometheus。

1. 启用 Flume HTTP 监控

  1. 确认 Flume HTTP 端口
    默认情况下,Flume 会在 41414 端口上暴露监控数据。可以在 Flume 配置文件(flume.conf)中检查:

    agent.monitoring.type=http
    agent.monitoring.port=41414
    
  2. 重启 Flume

    bin/flume-ng agent -n <agent-name> -c conf -f <config-file>
    
  3. 验证 HTTP 输出
    访问 http://<flume-host>:41414/metrics,可以看到 JSON 格式的监控数据。


2. 使用 HTTP Exporter 转换数据

Prometheus 不能直接抓取 JSON 数据,需要使用 HTTP Exporter 转换成 Prometheus 格式。

  1. 部署 HTTP Exporter
    下载并运行 HTTP Exporter(如 json_exporter)。

    wget https://github.com/prometheus-community/json_exporter/releases/download/v0.5.0/json_exporter-0.5.0.linux-amd64.tar.gz
    tar -xvzf json_exporter-0.5.0.linux-amd64.tar.gz
    
  2. 创建 HTTP Exporter 配置
    创建 config.yml 文件,定义 JSON 转换规则:

    metrics:- name: flume_events_receivedpath: $.Source.EventReceivedtype: GAUGE- name: flume_channel_sizepath: $.Channel.ChannelSizetype: GAUGE
    

    解释

    • path 定义了 JSON 数据中监控指标的位置(使用 JSONPath 语法)。
    • name 定义 Prometheus 的指标名称。
  3. 运行 HTTP Exporter

    ./json_exporter --config.file=config.yml --listen-address=":9100"
    

3. 配置 Prometheus

  1. 修改 Prometheus 配置文件

    scrape_configs:- job_name: 'flume-http'static_configs:- targets: ['<exporter-host>:9100']
    
  2. 重启 Prometheus

    systemctl restart prometheus
    
  3. 验证
    在 Prometheus 界面中搜索 flume_* ,可以看到 Flume 的 HTTP 数据。


总结

通过以上步骤,可以实现 Flume 到 Prometheus 的监控集成:

  1. 如果使用 JMX Exporter,修改 Flume 启动参数,直接暴露 JMX 数据。
  2. 如果使用 HTTP Exporter,将 Flume 的 HTTP 数据转换成 Prometheus 可读的格式。

        在生产环境中,推荐 JMX Exporter,因其性能更高,配置更灵活。而 HTTP Exporter 则适合无法直接使用 JMX 的场景。无论哪种方式,都能实现 Flume 的指标采集、报警和可视化。

http://www.lryc.cn/news/495055.html

相关文章:

  • 求平均年龄
  • Ardusub源码剖析(1)——AP_Arming_Sub
  • 【NLP 2、机器学习简介】
  • 数据结构与算法——N叉树(自学笔记)
  • 【趣味升级版】斗破苍穹修炼文字游戏HTML,CSS,JS
  • 【Oracle】个人收集整理的Oracle常用SQL及命令
  • Linux内核4.14版本——ccf时钟子系统(5)——通用API
  • 安装MySQL 5.7 亲测有效
  • 《Django 5 By Example》阅读笔记:p455-p492
  • Element-UI 官网的主题切换动画
  • Golang 构建学习
  • VM Virutal Box的Ubuntu虚拟机与windows宿主机之间设置共享文件夹(自动挂载,永久有效)
  • 分析 系统滴答时钟(tickClock),设置72MHz系统周期,如何实现1毫秒的系统时间?
  • C++优选算法十七 多源BFS
  • Mongodb入门到放弃
  • 青藤云安全携手财信证券,入选金融科技创新应用优秀案例
  • 在CentOS系统中安装工具包的时候报错的解决方法
  • cad软件打不开报错cad acbrandres dll加载失败
  • 14、保存与加载PyTorch训练的模型和超参数
  • 【前端开发】JS+Vuew3请求列表数据并分页
  • Trimble X12助力电力管廊数据采集,为机器人巡视系统提供精准导航支持
  • Docker 清理镜像策略详解
  • 【Linux】TCP网络编程
  • 排序学习整理(2)
  • AI蛋白质设计与人工智能药物设计
  • IOS ARKit进行图像识别
  • 初级数据结构——二叉搜索树
  • C++设计模式之组合模式中如何实现同一层部件的有序性
  • duxapp RN 端使用AppUpgrade 进行版本更新
  • 【计网】自定义序列化反序列化(三) —— 实现网络版计算器【下】