当前位置: 首页 > news >正文

Flink相关介绍

  •  简介

Flink的定位是:Apache Flink是一个框架和分布式处理引擎,如图所示,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境运行,以内存执行速度和任意规模来执行计算。

Flink框架处理流程
Flink 框架处理流程

  • 应用场景

1、电商和市场营销

举例:实时数据报表、广告投放、实时推荐在电商行业中,网站点击量是统计 PV、UV 的重要来源,也是如今“流量经济”的最主要数据指标。很多公司的营销策略,比如广告的投放,也是基于点击量来决定的。另外,在网站上提供给用户的实时推荐,往往也是基于当前用户的点击行为做出的。我们需要的是直接处理数据流,而 Flink 就可以做到这一点。
2、物联网(IOT)
举例:传感器实时数据采集和显示、实时报警,交通运输业物联网是流数据被普遍应用的领域。各种传感器不停获得测量数据,并将它们以流的形式传输至数据中心。而数据中心会将数据处理分析之后,得到运行状态或者报警信息,实时地显示在监控屏幕上。所以在物联网中,低延迟的数据传输和处理,以及准确的数据分析通常很关键。
3、物流配送和服务业
举例:订单状态实时更新、通知信息推送在很多服务型应用中,都会涉及订单状态的更新和通知的推送。这些信息基于事件触发, 不均匀地连续不断生成,处理之后需要及时传递给用户。这也是非常典型的数据流的处理。
4、银行和金融业
举例:实时结算和通知推送,实时检测异常行为银行和金融业是另一个典型的应用行业。在全球化经济中,能够提供 24 小时服务变得越来越重要。现在交易和报表都会快速准确地生成,我们跨行转账也可以做到瞬间到账,还可以接到实时的推送通知。这就需要我们能够实时处理数据流。
  • 特性总结

核心特性

  1. 高吞吐和低延迟。每秒处理数百万个事件,毫秒级延迟。
  2. 结果的准确性。Flink提供了事件时间(event-time)和处理时间(processing-time)语义。对于乱序事件流,事件时间语义仍然能够提供一致且准确的结果。
  3. 精准一次(exactly-once)的状态一致性保证。
  4. 可以连接到常见的存储系统。如kafka、es、jdbc和分布式文件系统如HDFS等。
  5. 高可用。本身高可用的设置,加上与k8s,YARN等的紧密集成,在加上从故障中快速恢复和动态扩展任务的能力,Flink能做到以极少的时间提供7*24小时全天候运行。
  6. 能够更新应用程序代码并将作业迁移到不同的flink集群,而不会丢失应用程序的状态。

分层API

http://www.lryc.cn/news/34682.html

相关文章:

  • Java 8 排序
  • Blazor_WASM之4:路由
  • 对Vue响应式的理解
  • 磁盘阵列Raid探讨
  • 基于MyBatis依次、批量、分页增删改查
  • Tomcat源码分析-Session源码解析
  • 常见数据模型
  • Lesson 8.3 ID3、C4.5 决策树的建模流程 Lesson 8.4 CART 回归树的建模流程与 sklearn 参数详解
  • 阿里云手机短信登录
  • Android Camera SDK NDK NDK_vendor介绍
  • SQL基础语句小结
  • 管理类书籍推荐
  • win10 mingw 调用python
  • 教你使用三种方式写一个最基本的spark程序
  • 软件设计师错题集
  • 【华为机试真题详解 Python实现】静态扫描最优成本【2023 Q1 | 100分】
  • 算法刷题总结 (四) 动态规划
  • Grafana 转换数据的工具介绍
  • Linux 学习笔记
  • HTML注入专精整理
  • 看完这篇我不信你不会二叉树的层序遍历【C语言】
  • 案例17-环境混用带来的影响
  • 知识蒸馏论文阅读:DKD算法笔记
  • Sentinel架构篇 - 熔断降级
  • shell脚本的一些记录 与jenkins的介绍
  • JVM的了解与学习
  • 提升数字品牌的5个技巧
  • java通过反射获取加了某个注解的所有的类
  • Warshall算法
  • vector中迭代器失效的问题及解决办法