当前位置: 首页 > news >正文

Flink DataStream API 编程指南

(对于Flink的开发,建议使用Java,Scala的支持未来会被移除)

DataStream是什么

DataStream API得名于DataStream这个Java类,可以将它们视为可以包含重复项的不可变数据集合。该数据可以是有限的,也可以是无限的,用于处理它们的API是相同的。

DataStream在用法上和普通的Java集合类似,但在一些关键方面有很大的不同。它们是不可变的,这意味着一旦创建了它们,就不能添加或删除元素。你可以在上面执行各种transformations操作。

通过在Flink程序中添加数据源,可以创建初始的DataStream。然后你可以由此派生出新的流,并使用map、filter等API方法将它们组合起来。

剖析Flink程序整体过程

Flink程序就是对DataStream的各种转换(transformations)的过程,每个程序由相同的基本部分组成:

  1. 获取执行环境
  2. 加载/创建初始数据
  3. 指定此数据的转换
  4. 指定将计算结果的存放位置
  5. 触发程序执行

下面以java api的方式来说明以上过程:

1)获取执行环境

可以通过 StreamExecutionEnvironment 的方法来获得:

http://www.lryc.cn/news/507563.html

相关文章:

  • tryhackme-Pre Security-HTTP in Detail(HTTP的详细内容)
  • 探索 Plotly:一个强大的交互式数据可视化库
  • Oracle 查询表占用空间(表大小)的方法
  • 机器人国际会议IROS论文latex模板
  • 雪泥鸿爪和屈指可数
  • 2024年度个人总结
  • ChatGPT接口测试用例生成的流程
  • 【读书笔记】《论语别裁》真人和假人
  • JS字符串方法汇总
  • CentOs7使用yum安装docker
  • 蓝桥杯刷题——day8
  • 如何使用 WebAssembly 扩展后端应用
  • BaseCTF_web_week3
  • 模型数据算法概论
  • 什么是3DEXPERIENCE SOLIDWORKS,它有哪些角色和功能?
  • Sigrity System SI Parallel Bus Analysis模式进行DDR3仿真分析-传输线模型
  • MacOS下PostIn安装配置指南
  • 【Leetcode 每日一题】2545. 根据第 K 场考试的分数排序
  • 一文速通 IIC I2C子系统驱动 通信协议原理 硬件 时序 深度剖析
  • HarmonyOS(72)事件拦截处理详解
  • docker(wsl)命令 帮助文档
  • nginx 拦截指定ip访问指定 url
  • git仓库的基本概念和流程以及一些基本命令
  • Intel-ECI之Codesys PLC + Ethercat 远端IO + Codesys IDE编程
  • 互联网医院系统,互联网医院系统源码可供
  • Marin说PCB之POC电路layout设计仿真案例---06
  • windwos defender实现白名单效果(除了指定应用或端口其它一律禁止)禁止服务器上网
  • Fiddler勾选https后google浏览器网页访问不可用
  • 机器视觉检测相机基础知识 | 颜色 | 光源 | 镜头 | 分辨率 / 精度 / 公差
  • 解决pytorch安装中的三个错误