当前位置: 首页 > news >正文

Apache StreamPark系列教程第一篇——安装和体验

一、StreamPark介绍

实时即未来,在实时处理流域 Apache Spark 和 Apache Flink 是一个伟大的进步,尤其是Apache Flink被普遍认为是下一代大数据流计算引擎, 我们在使用 Flink & Spark 时发现从编程模型, 启动配置到运维管理都有很多可以抽象共用的地方, 我们将一些好的经验固化下来并结合业内的最佳实践, 通过不断努力终于诞生了今天的框架 —— StreamPark, 项目的初衷是 —— 让流处理更简单, 使用StreamPark开发,可以极大降低学习成本和开发门槛, 让开发者只用关心最核心的业务,StreamPark 规范了项目的配置,鼓励函数式编程,定义了最佳的编程方式,提供了一系列开箱即用的Connectors,标准化了配置、开发、测试、部署、监控、运维的整个过程, 提供了scalajava两套api, 其最终目的是打造一个一站式大数据平台,流批一体,湖仓一体的解决方案

框架介绍 | Apache StreamPark (incubating)

二、安装快速体验

官网提供了jar包安装和docker安装,本文先简单使用docker 安装来快速体验StreamPark

首先机器上需要安装docker和docker compose,可以先参考下官网下载相关文件

Docker 快速使用教程 | Apache StreamPark (incubating)

默认是h2数据库,如果需要使用mysql数据库需要修改参考下面文档Docker 快速使用教程 | Apache StreamPark (incubating)

确保Flink和StreamPark都能访问正常,需要配置Flink Home信息

Flink Home路径填写:/StreamPark/flink/flink14.5/   其他不用修改参考上图

集群配置信息

地址信息填写:http://localhost:8081 或者宿主机ip 其他不用修改参考下图

 修改Application里面自带的Flink SQL demo 任务,即可成功运行

修改完成之后点击release(发布作业)然后start(启动作业),任务即可启动成功。

备注:Flink SQL demo会运行一段时间之后自动结束,因为代码里面设置自动生成数据是增量数据,如果想任务一直运行

去掉自增设置同时改为最小和最大值成为随机数
'fields.f_sequence.min'='1',
'fields.f_sequence.max'='500',

这样job就能一直运行起来 ,而不会运行一段时间就停止了。

http://www.lryc.cn/news/136890.html

相关文章:

  • mysql replace insert update delete
  • 实现SSM简易商城项目的商品查询功能
  • 视频批量剪辑矩阵分发系统源码开源分享----基于PHP语言
  • 亚信科技AntDB数据库通过GB 18030-2022最高实现级别认证,荣膺首批通过该认证的产品之列
  • 第11章 优化多线程应用程序
  • 分布式下的session共享问题
  • webrtc的Sdp中的Plan-b和UnifiedPlan
  • LLM-Rec:基于提示大语言模型的个性化推荐
  • microsoft -en - us 无法卸载
  • day43参与通信的服务器
  • K8S如何部署ZooKeeper以及如何进行ZooKeeper的平滑替换
  • Leetcode刷题之1658. 将 x 减到 0 的最小操作数
  • 海外网红营销中的创新技术与趋势:AI、AR和VR的应用探索
  • Vant 4.6.4发布,增加了一些新功能,并修复了一些bug
  • Linux权限维持—Strace监控Alias别名Cron定时任务
  • 微服务中间件--统一网关Gateway
  • Fabric.js 元素选中状态的事件与样式
  • 数据通信——传输层(UDP)
  • Python(八十六)字符串的编码与解码
  • Android OkHttp 源码浅析二
  • Python(八十四)字符串的切片操作
  • leetcode-506.相对名次-day17
  • 【QT】绘制旋转等待
  • Electron学习3 使用serialport操作串口
  • 激活函数总结(十七):激活函数补充(PELU、Phish)
  • [bug日志]springboot多模块启动,在yml配置启动端口8081,但还是启动了8080
  • 【每日易题】七夕限定——单身狗问题以及进阶问题位运算法的深入探讨
  • 消息队列前世今生 字节跳动 Kafka #创作活动
  • 『SEQ日志』在 .NET中快速集成轻量级的分布式日志平台
  • Django会话技术