当前位置: 首页 > news >正文

Flink+Spark相关记录

Flink+Spark相关记录


  • FlinkSQL

  • Flink Streaming的一些点
  • 覆写RichSource、RichSink、RichMap
    1.Source自动负载均衡,CDC源端加入一个全局调控的节点监控流量流速
    2.Sink并发写入
    3.Map与Iterator与增量迭代等用法
  • 关于Checkpoint几个用法
    1.提交Commit至目的端数据库
    2.UnalignedCheckpoint与ChandyLamport与ChangeLog存增量快照
    3.Buffer写盘
    4.ckp与record共抢一把锁,独占writeBuffer(1.16版本),ckp禁止太快
    5.State写盘+broadcast+JVM+keyState+operatorState+并行度自动扩缩容时恢复

Spark记录

  • groupByKey
  • reduceByKey
  • combineByKey(createCombiner+mergeValue+mergeCombiner)
  • aggregate(n)(seqOp,combOp)
  • 关于ByKey和Join不一定会产生shuffle,先设置好new HashPartition或Custom或Range、之后直接forward不需要shuffle
  • Driver产生一个DAG
    1.一个DAG里的一个节点=>一个RDD
    2.一个RDD=>多个分区
    3.一个分区=>一个Task
    ===>一个DAG有多个RDD,一个RDD有多个Task
    ===>也就是DAG控制多个弹性数据集流转

  • JVM与堆外内存
  • JVM里的StorageMemory(读RDD用)和ExecutionMemory(shuffle/agg/join用)
  • 关于合理设计Block->TaskPartition大小,(4G-200M)*0.5,又因为动态可以弹性,可直接3.8G
  • Spark设置cache和persist缓存级别(每个分区的都会cache,cache务必保证100%否则重算)
  • 对于Flink又有一个slot(JVM)里运行多个算子,所以可以考虑slot内数据总量和资源消耗整体分析
  • 关于Executor add后很久才执行,说明任务调度拥堵
  • 堆外内存

http://www.lryc.cn/news/441140.html

相关文章:

  • 2023 hnust 湖科大 毕业实习 报告+实习鉴定表
  • ConflictingBeanDefinitionException | 运行SpringBoot项目时报错bean定义冲突解决方案
  • 如何切换淘宝最新镜像源(npm)【2024版】
  • YoloV10改进策略:Block改进|PromptIR(NIPS‘2023)|轻量高效,即插即用|(适用于分类、分割、检测等多种场景)
  • 使用rust自制操作系统内核
  • Flink难点和高阶面试题:Flink的状态管理机制如何保证数据处理的准确性和完整性
  • 【激励广告带来的广告收入与用户留存率的双重提升】
  • 指针和引用;内联函数和普通函数
  • 简单题67.二进制求和 (java)20240919
  • DDD的主要流程
  • linux驱动开发-设备树
  • 数据结构——二叉树堆的专题
  • 【C语言零基础入门篇 - 7】:拆解函数的奥秘:定义、声明、变量,传递须知,嵌套玩转,递归惊艳
  • ClickHouse在AI领域的结合应用
  • git push出错Push cannot contain secrets
  • OpenAI 的最强模型 o1 的“护城河”失守?谷歌 DeepMind 早已揭示相同原理
  • 【胡乱念叨】大模型的“我”
  • Flag_AGtivity_clear_top网页编程指南如何退出多activity程序
  • 克隆centos网卡uuid相同如何修改
  • C语言习题~day11
  • Ansible——Playbook基本功能???
  • 多线程学习篇一:启动多线程的三种方式
  • 【专题】2024跨境出海供应链洞察-更先进供应链报告合集PDF分享(附原数据表)
  • git submodule
  • 【Power Compiler手册】13.UPF多电压设计实现(3)
  • RTX 4090 系列即将停产,RTX 5090 系列蓄势待发
  • 【MySQL】使用C语言连接数据库
  • Vue学习记录之四(watch侦听器和watchEffect高级侦听器)
  • RedisTemplate操作ZSet的API
  • Android 15 正式发布至 AOSP