当前位置: 首页 > news >正文

Flink如何设置合理的并行度

一个Flink程序由多个Operator组成(source、transformation和 sink)。

一个Operator由多个并行的Task(线程)来执行, 一个Operator的并行Task(线程)数目就被称为该Operator(任务)的并行度(Parallel)。即并行度就是相对于Operator来说的。

合理设置并行度可以有效提高Flink作业的性能,但并行度的设置需要根据souce、sink类别、数据量、任务复杂度、集群资源等多个因素综合考虑。下面我们也是从source、transformation和sink来考虑一些优化措施:

1. Kafka Source和Sink的并行度设置

对于Kafka,不管是作为source还是sink,我们都建议将其并行度设置为和Kafka Topic分区数一致,这样每个subtask都能处理一个分区的数据。设置并行度小于Topic分区数则有subtask会读取多个分区数据,有可能会导致数据积压;而设置大于Topic分区数,会导致有subtask不能接收到数据,一是浪费并行度资源,另一方面如果用到watermark,则导致无法产生watermark的问题,影响下游的计算。如果已经等于Kafka的分区数,消费速度仍跟不上数据生产速度,考虑下Kafka要扩大分区,同时调大并行度等于分区数。如果kafka数据量很小,则可以直接设置为1。

2. JDBC Source和Sink的并行度设置

对于

http://www.lryc.cn/news/517549.html

相关文章:

  • 小兔鲜儿:生鲜区域,最新专题
  • TypeScript语言的网络编程
  • 复合机器人助力手机壳cnc加工向自动化升级
  • 在 C# 中显示动画 GIF 并在运行时更改它们
  • 个人博客搭建(二)—Typora+PicGo+OSS
  • Cloudflare IP 优选工具:轻松找到最快的 CDN 节点
  • HTB:Ransom[WriteUP]
  • Eclipse配置Tomcat服务器(最全图文详解)
  • STM32烧写失败之Contents mismatch at: 0800005CH (Flash=FFH Required=29H) !
  • 用户界面的UML建模10
  • 电影动画shader解析与实现
  • 蓝桥杯 第十五届 研究生组 B题 召唤数学精灵
  • 在 Go 应用中 如何像 FastAPI 一样优雅地构建控制器
  • 用户界面的UML建模11
  • 历代iPhone运行内存大小和电池容量信息
  • 计算机网络之---物理层设备
  • 57. Three.js案例-创建一个带有聚光灯和旋转立方体的3D场景
  • 第八讲 一元函数积分学的概念和性质
  • ADMM原理及应用
  • mysql之sql的优化方案(重点)
  • 【LeetCode】303. 区域和检索 - 数组不可变
  • 前端开发 vue 中如何实现 u-form 多个form表单同时校验
  • 【网络】什么是速率 (Rate)带宽 (Bandwidth)吞吐量 (Throughput)?
  • (leetcode算法题)769. 最多能完成排序的块
  • 高光谱相机的特点
  • 《Spring Framework实战》8:4.1.3.Bean 概述
  • BGP的local_preference本地优先级属性
  • IP地址与端口号
  • Fastapi + vue3 自动化测试平台(2)--日志中间件
  • iOS - AutoreleasePool