当前位置: 首页 > news >正文

Pulsar IO实战

一、引言

今天跟着 官方文档 基于docker玩一把Pulsar IO吧

二、概要

  • 在用户能够轻松的将消息队列跟其他系统(数据库、其他消息系统)一起使用时,消息队列的作用才是最强大的。而Pulsar IO connectors可以让你很轻松的创建、部署以及管理这些跟外部系统的连接,例如mysql、kafka、cassandra等。

  • Pulsar connector分为Source和Sink两种,Source connector会将数据从外部系统喂给Pulsar,而Sink connector负责将数据从Pulsar喂给外部系统。

  • Pulsar connector是一种特殊的Function,只不过这个Function持有其他系统的客户端作为pulsar与其他系统的桥梁,它在处理保证上跟Function是一致的,分别是最多一次、至少一次、精准一次。处理保证不仅依靠Pulsar,还跟外部系统相关以及实现逻辑相关。

    • 最多一次:发给connector的消息最多处理一次或者不做处理
    • 至少一次:发给connector的消息处理一次或者多次
    • 精准一次:发给connector的消息只处理一次

三、实战

1.安装connector

  1. 在 这里 下载对应的connector,先选择对应的版本,在点进 connectors 目录选择对应的source或者sink
    在这里插入图片描述

  2. 将下载的nar文件放到pulsar安装地址的connectors 目录下(没有则需要创建)
    在这里插入图片描述

  3. 启动Pulsar

  4. 通过指令查看服务connector信息,先输出下面这样的信息就说明connector已经注册到Pulsar上面了

    curl -s http://localhost:8080/admin/v2/functions/connectors
    

    在这里插入图片描述

2. 安装Cassandra

  1. 基于 brew install --cask --appdir=/Applications docker 安装docker(仅针对mac环境)

  2. 基于docker运行 cassandra,成功运行后通过 docker ps可以看到Cassandra服务已经起来了

    docker run -d --rm --name=cassandra -p 9042:9042 cassandra:3.11
    

在这里插入图片描述

  1. 通过 docker exec -ti cassandra cqlsh localhost 进入Cassandra服务的容器,并通过以下指令进行库表的初始化

    CREATE KEYSPACE pulsar_test_keyspace WITH replication = {'class':'SimpleStrategy', 'replication_factor':1};USE pulsar_test_keyspace;CREATE TABLE pulsar_test_table (key text PRIMARY KEY, col text);
    
  2. 先查询该表确保没有数据 select * from pulsar_test_table;
    在这里插入图片描述

3. 功能验证

  1. 写配置文件cassandra-sink.yml

    configs:roots: "localhost:9042"keyspace: "pulsar_test_keyspace"columnFamily: "pulsar_test_table"keyname: "key"columnName: "col"
    
  2. 启动写Cassandra的sink,启动后通过指令查看显示sink已经正常启动

pulsar-admin sinks create \--tenant public \--namespace default \--name cassandra-test-sink \--sink-type cassandra \--sink-config-file examples/cassandra-sink.yml \--inputs test_cassandra

在这里插入图片描述

  1. 执行命令批量往pulsar中写入数据,看是否会正常输出到Cassandra中

    for i in {0..9}; do pulsar-client produce -m "key-$i" -n 1 test_cassandra; done
    
  2. 由于上面的操作是有延迟的,所以不断的查询Cassandra的表是可以看到数据在逐步的增加,并最终写满十条数据
    在这里插入图片描述
    在这里插入图片描述

四、总结

纸上得来终觉浅,绝知此事要躬行。 学习不能仅仅停留在纸面上或者理论,脱离使用去探讨设计或者源码都是不切实际的。因此今天一起体验了一把Pulsar IO,除此之外Pulsar还提供了非常丰富的跟其他系统交互的Connector,详细可以看上面发的下载地址并尝试使用自己感兴趣的Connector感受下实操的快乐~

http://www.lryc.cn/news/317920.html

相关文章:

  • Linux/Ubuntu/Debian基本命令:文本操作
  • Self-supervised Contextual Keyword and Keyphrase Retrieval with Self-Labelling
  • 新 树莓派4B 温湿度监测 基于debian12的树莓派OS
  • 人工智能入门之旅:从基础知识到实战应用(一)
  • GNN/GCN自己学习
  • honle电源维修UV电源控制器维修EVG EPS60
  • 【学习心得】Python好库推荐——websocket-client
  • 3.1_8 两级页表
  • 【SysBench】sysbench-1.20 命令速查表
  • neo4j网页无法打开,启动一会儿后自动关闭,查看neo4j status显示Neo4j is not running.
  • 一键卸载和安装 nvidia、cuda、cudnn、tensorrt
  • LeetCode 389. 找不同
  • 科技云报道:两会热议的数据要素,如何拥抱新技术?
  • 【linux】进程管理:进程控制块、进程号、fork创建进程、特殊进程及exec函数族解析
  • 【DL经典回顾】激活函数大汇总(八)(Maxout Softmin附代码和详细公式)
  • Docker进阶:深入了解 Dockerfile
  • 【LeetCode热题100】206. 反转链表(链表)
  • 电玩城游戏大厅计时软件怎么用,佳易王计时计费管理系统软件定时语音提醒操作教程
  • selenium也能过某数、5s盾..
  • mysql笔记:8. 视图
  • 指针的基本概念和用法
  • 工作随记:oracle重建一张1T数据量的大表
  • 使用timm库的一些知识点
  • 一种基于宏和serde_json实现的rust web中统一返回类
  • 每周一算法:A*(A Star)算法
  • 爬虫练习:获取某网站的房价信息
  • 第一个C语言hello world
  • 【Python】新手入门学习:详细介绍依赖倒置原则(DIP)及其作用、代码示例
  • 嵌入式驱动学习目录索引(更新中)
  • ruoyi-vue插件集成websocket