当前位置: 首页 > news >正文

【Linux】:Kafka组件介绍

目录

环境简介

一、消息

二、主题

三、分区

四、副本

五、生产者

六、消费者

七、消费者组

八、offsets【偏移量】


环境简介

   Linux内核:Centos7

   Kafka版本:3.5.1

   执行命令的目录位置:Kafka安装目录的bin目录下:/usr/local/kafka/bin/

一、消息

        kafka中消息可以分为单播类型消息和多播类型消息

            单播消息:多个消费者监听同一个主题,有且只有一个消费者能消费该主题下的消息。

            多播消息:多个消费者监听同一个主题,每一个消费者都能完整的消费该主题下的消息。

            单播消息、多播消息如何实现,请参考【消费者组】说明

二、主题

        1.消息按主题分类

        2.消费者通过监听主题名称来消费消息

        3.消息是以log文件的方式存储,存储在配置文件中配置的log.dirs目录下

 

        4.该目录下存在以主题命名对的文件夹,该文件夹下就存储了当前主题的消息文件(分为三种形式同时存储):

                .log:日志文件
                .index:索引文件,以稀疏索引方式存储  某个时间段以内的索引是在.index中的哪个位置
                .timeIndex:时间索引文件

        5.如果同一个TOPIC下的消息数量过多,多到需要几T来存储,因为消息时以log文件的方式存储的,可以使用Partition分区来管理消息文件。

三、分区

       1.如果同一个主题下的消息数量过多,多到需要几T来存储,此时单一的log文件就会过大,此时可以通过分区Partitions来管理消息文件。

       2.kafka配置文件中默认的主题分区数是1

       3.创建主题时,如果不指定分区数的话,则使用默认分区数

       4.创建主题时,如果指定分区数量,则需要同时指定副本数量

       5.主题创建完成后,可以二次更改主题的分区数,只不过修改后的分区数只能大于修改前的分区数

       6.创建主体时,如果指定了多个分区,那么在log.dirs配置的目录下,就会存在多个该主题命名的文件夹,每一个文件夹下,就存储当前分区下的日志,如图(topic0918是创建了两个分区):

   

       7.优点:
            解决单存储文件过大的问题
            可以分布式存储
            可以提高消息的吞吐量(消息的读取可以同时从多分区中进行) 

四、副本

        在集群中使用到的概念

五、生产者

        消息的发送者,不再赘述

六、消费者

        1.消息的监听者

        2.可以从主题的第一条消息开始监听【--from-begging】

        3.也可以从主题的最新一条消息开始监听

        4.其他不再赘述

七、消费者组

        1.在使用kafka原生名称创建消费者时,可以同时将创建的消费者给放入一个自定义名称的消费者组中。

        2.消费者组的作用:

            实现单播消息:同一个消费者组下的多个消费者同时监听同一个消息主题,只有一个消费者可以监听到主题中的消息,且在该消费者存货期间,一直由该消费者监听。如果该消费者down掉以后,再由当前消费者组中的其他任一消费者监听。

八、offsets【偏移量】

        1.kafka消费者在消费消息是,会自动提交偏移量,来记录消息的消费位置,以保证后续的正常继续消费。

        2.kafka可设置为手动提交偏移量

        3.在kafka的dir.logs目录的日志文件夹下,除了用户创建的主题文件夹外,还有默认的_consumer_offset-0 ~ _consumer_offset-49,共50个文件夹(其实就是50个分区)

         4.kafka通过这些文件夹用来记录消费者消费主题的偏移量(即kafka提交的消费偏移量以k-v形式存储在了_consumer_offset中): 

            key值是consumerGroupId+topic+分区, value值是当前消费的offset

        5.kafka默认分配50个分区,通过offset.topic.num.partitions来设置,  通过如下公式,可选出consumer消费的offset要提交到哪个_consumer_offsets分区中:

            hash(consumerGroupId)%_consumer_offset主题的分区数

http://www.lryc.cn/news/176687.html

相关文章:

  • Redis〔篇〕
  • 龙芯2K1000核心板在智能座舱行业产品方案-迅为电子
  • 2023/9/20 -- C++/QT
  • WordPress主题DUX v8.2源码下载
  • c++图像的边缘检测
  • C++ Primer 类和对象(3)
  • IntelliJ IDEA 介绍、安装、配置优化与快捷键大全
  • css 语法笔记
  • 【初阶数据结构】二叉树全面知识总结
  • CMD命令终端快捷键学习
  • Leetcode198. 打家劫舍
  • 前端技术社区总目录
  • 极客时间:左耳听风【文章笔记 思考总结】
  • 《论文阅读27》SuperGlue: Learning Feature Matching with Graph Neural Networks
  • 远程计算机或设备不接受连接解决方法
  • 基于Python实现的快递管理系统源码+数据库,采用PyQt6实现GUI界面
  • 如何使用docker快速部署MinDoc文档系统
  • 9月25日,每日信息差
  • 【网络协议】Https
  • Lostash同步Mysql数据到Elasticsearch(三)Elasticsearch模板与索引设置
  • python——ptp()函数
  • SpringBoot之异常处理
  • Flask-[实现websocket]-(2): flask-socketio文档学习
  • 网页中使用的图片格式
  • 【android】如何设置LD_LIBRARY_PATH?
  • 【hadoop3.x】一 搭建集群调优
  • linux使用操作[2]
  • 华南理工大学电子与信息学院23年预推免复试面试经验贴
  • Linux网络编程- ether_header iphdr tcphdr
  • wpf中的StaticResource和DynamicResource