当前位置: 首页 > news >正文

大数据课程I2——Kafka的架构

文章作者邮箱:yugongshiye@sina.cn              地址:广东惠州

 ▲ 本章节目的

⚪ 掌握Kafka的架构;

⚪ 掌握Kafka的Topic与Partition;

一、Kafka核心概念及操作

 

1. producer生产者,可以是一个测试线程,也可以是某种技术框架(比如flume)。

2. producer向kafka生产数据,必须指定向哪个主题去生产数据。

3. 主题topic,主题是由用户(程序员)自己来创建的。

4. 创建主题的指令:

sh kafka-topics.sh --create ---zookeeper hadoop01:2181

--replication-factor 1 --partitions 1 --topic enbook

5. 查看kafka集群的所有主题:

sh kafka-topics.sh --list --zookeeper hadoop01:2181

6. 创建一个主题,需要指定:

①主题名

②主题的分区数量

③分区的副本数量

7. 主题的分区:本质上就是一个分区文件目录。

分区目录的命名规则:主题名 - 分区编号(分区编号从0开始)。

思考:kafka主题引入分区机制的作用?

回答:可以分布式的对一个主题的数据进行存储和管理。

补充:主题的分区数量可以远大于kafka broker 服务器数量。kafka底层尽可能确保分区目录的负载均衡。比如:一个主题有10个分区,有3个broker服务器,则分区目录的数量分配:3-3-4。

8. 启动一个生产者线程。

sh kafka-console-producer.sh --broker-list

hadoop01:9092, hadoop02:9092, hadoop03:9092 --topic enbook

9. producer向kafka指定的主题生产数据,数据最终是存到了分区目录下的log文件中。此外kafka底层会确保每个分区目录的数据达到负载均衡的效果(轮询发送给每个分区目录)。

10. Kafka支持数据的容错机制,即分区数据丢失后,可以恢复。通过副本冗余机制来实现的。即我们在创建主题时,可以指定每个分区有多个副本。

补充:如果出现kafka创建主题分区异常。

http://www.lryc.cn/news/128476.html

相关文章:

  • vscode如何汉化
  • matlab保存图片
  • 产业园区数字孪生3d可视化全景展示方案
  • centos7 jupyter notebook 安装自动补全插件
  • 【算法——双指针】LeetCode 202 快乐数
  • AndroidManifest清单文件中,Activity的screenOrientation属性详解
  • Qt+Pyhton实现麒麟V10系统下word文档读写功能
  • TCP/IP 下的计算机网络江湖
  • 智能家居(4)---火灾报警线程封装
  • C#语音播报问题之 无法嵌入互操作类型SpVoiceClass,请改用适用的窗口
  • C语言实例_获取文件MD5值
  • Win11环境下 Unity个人版无法激活
  • C++:模拟实现list及迭代器类模板优化方法
  • k8s整合istio配置gateway入口、配置集群内部服务调用管理
  • 工程监测振弦采集仪采集到的数据如何进行分析和处理
  • (三)行为模式:2、命令模式(Command Pattern)(C++示例)
  • 微信小程序 蓝牙设备连接,控制开关灯
  • Python 矢量数据库和矢量索引:构建 LLM 应用程序
  • -Webkit-Box 在 Safari 中出现的兼容性问题
  • 后端项目打包上传服务器记录
  • ubuntu部署haproxy
  • vue利用 sortable 完成表格拖拽
  • CNN简介3
  • 新能源电动车充电桩控制主板安全特点
  • 公路桥梁有哪些安全隐患?
  • 【C语言】每日一题(错误的集合)
  • [JavaWeb]【四】web后端开发-SpringBootWeb入门
  • 前端css
  • vb+sql医院门诊管理系统设计与系统
  • bootstrap-modal调用ajax后不经过回调函数