当前位置: 首页 > news >正文

Flink的DateStream API中的ProcessWindowFunction和AllWindowFunction两种用于窗口处理的函数接口的区别

目录

ProcessWindowFunction

AllWindowFunction

具体区别

ProcessWindowFunction 示例

AllWindowFunction 示例

获取时间不同,一个数据产生的时间一个是数据处理的时间

ProcessWindowFunction

AllWindowFunction

具体示例

ProcessWindowFunction 示例

AllWindowFunction 示例

总结


在Flink的DataStream API中,ProcessWindowFunctionAllWindowFunction是两种用于窗口处理的函数接口。它们之间的主要区别在于应用的上下文和作用的粒度。

ProcessWindowFunction

ProcessWindowFunction 是一种更灵活和强大的窗口处理函数。它允许你对每个窗口中的所有元素进行处理,并且可以访问窗口的元数据信息,比如窗口的开始时间和结束时间。

  • 用法:适用于对每个窗口中的元素进行复杂处理的场景。
  • 调用上下文:用于 keyed streams(即,已经通过 keyBy 操作进行了分区的流)。
  • 函数签名

AllWindowFunction

AllWindowFunction 则是一个较为简单的窗口处理函数,用于处理没有分区的流中的所有元素。

  • 用法:适用于不需要按键分区的场景,对整个流的所有元素进行窗口处理。
  • 调用上下文:用于 non-keyed streams(即,未通过 keyBy 操作进行分区的流)。
  • 函数签名  

具体区别

  1. 应用场景

    • ProcessWindowFunction 适用于 keyed streams,每个窗口中的元素会按照键进行分组。
    • AllWindowFunction 适用于 non-keyed streams,对整个流中的所有元素进行处理。
  2. 参数

    • ProcessWindowFunction 中的 process 方法接收一个键(key)参数,而 AllWindowFunction 中的 apply 方法没有键参数。
    • ProcessWindowFunction 可以访问窗口的上下文信息(如窗口的开始和结束时间),而 AllWindowFunction 则只能访问窗口和元素。
  3. 复杂性

    • ProcessWindowFunction 提供了更多的功能和灵活性,可以访问更多的上下文信息,适用于更复杂的窗口计算。
    • AllWindowFunction 较为简单,适用于不需要按键处理的简单场景。

ProcessWindowFunction 示例

AllWindowFunction 示例

通过了解这些区别,可以根据具体需求选择合适的窗口函数接口,来实现所需的窗口计算逻辑

获取时间不同,一个数据产生的时间一个是数据处理的时间

ProcessWindowFunctionAllWindowFunction 在处理时间方面也有所不同。具体来说,它们处理的时间语义是基于 Flink 的事件时间(event time)或处理时间(processing time),但获取时间的方式和内容有所不同。

ProcessWindowFunction

ProcessWindowFunction 中,你可以访问窗口的元数据,包括窗口的开始时间和结束时间。这些时间通常是基于事件时间(event time)的。Flink 提供了上下文(context)对象,可以通过它来获取这些信息。

  • 获取窗口时间

    context.window().getStart(); context.window().getEnd();

  • 事件时间: 通过 context.timestamp() 可以获取当前处理的事件的事件时间。

  • 处理时间: Flink 也允许你获取当前的处理时间,通过调用 System.currentTimeMillis() 或使用 context.currentProcessingTime()

AllWindowFunction

AllWindowFunction 中,你同样可以获取窗口的开始时间和结束时间,但获取这些信息的方式稍有不同。

  • 获取窗口时间
    window.getStart(); window.getEnd();
    

具体示例

ProcessWindowFunction 示例

AllWindowFunction 示例

 

总结

  • ProcessWindowFunction:通过 context 对象可以获取窗口的开始时间、结束时间、事件时间和处理时间。
  • AllWindowFunction:通过 window 对象可以获取窗口的开始时间和结束时间,可以通过 System.currentTimeMillis() 获取当前处理时间。

因此,两者在获取时间信息的细节上有所不同,但总体来说,ProcessWindowFunction 提供了更多的上下文信息,允许你更灵活地访问时间信息

http://www.lryc.cn/news/414913.html

相关文章:

  • MATLAB中dmperm函数用法
  • 苹果折叠屏设备:创新设计与技术突破
  • C#加班统计次数
  • 【资治通鉴】“ 将欲取之、必先予之 “ 策略 ① ( 魏桓子 割让土地 | 资治通鉴原文分析 | 道德经、周书、吕氏春秋、六韬 中的相似策略 )
  • Spring5 的日志学习
  • python爬虫实践
  • 【前端面试】七、算法-数组展平
  • Laravel php框架与Yii php 框架的优缺点
  • 使用 addRouteMiddleware 动态添加中间
  • Zookeeper未授权访问漏洞
  • 【JavaEE】定时器
  • 2024带你轻松玩转Parallels Desktop19虚拟机!让你在Mac电脑上运行Windows系统
  • 【算法】递归实现二分查找(优化)以及非递归实现二分查找
  • CDN 是什么?
  • 索引:SpringCloudAlibaba分布式组件全部框架笔记
  • 2024第五届华数杯数学建模竞赛C题思路+代码
  • FFmpeg源码:av_reduce函数分析
  • nginx: [error] open() “/run/nginx.pid“ failed (2: No such file or directory)
  • <数据集>BDD100K人车识别数据集<目标检测>
  • 利用SSE打造极简web聊天室
  • 代码随想录第二十天|动态规划(4)
  • TreeSize:免费的磁盘清理与管理神器,解决C盘爆满的燃眉之急
  • 如何建立自己的技术知识体系
  • JS优化了4个自定义倒计时
  • 模型实战(25)之 基于LoFTR深度学习匹配算法实现图像拼接
  • 计算机毕业设计Python+Spark知识图谱高考志愿推荐系统 高考数据分析 高考可视化 高考大数据 大数据毕业设计
  • 【python】文件
  • 《Attention Is All You Need》核心观点及概念
  • 【中项】系统集成项目管理工程师-第9章 项目管理概论-9.9价值交付系统
  • JS+H5美观的带搜索的博客文章列表(可搜索多个参数)