当前位置: 首页 > news >正文

数据湖Data Lakehouse支持行级更改的策略:COW、MOR、Delete+Insert

COW:写时复制,MOR:读时合并,Delete+Insert:保证同一个主键下仅存在一条记录,将更新操作转换为Delete操作和Insert操作
COW和MOR的对比如下图,而Delete+Insert在StarRocks主键模型中用到。
目前COW、MOR在三大开源数据湖项目的使用情况,如下图。
在这里插入图片描述
在这里插入图片描述

写入时复制【Copy-On-Write COW】

适用场景

  • 频繁读取、不频繁写入/更新的表
  • 大批量更新的表

核心思想

使用 COW,当更改以删除或更新一个或多个特定行时,将复制包含这些行的数据文件,但新版本具有更新的行。
这会使写入速度变慢,具体取决于必须重写的数据文件数,这可能导致并发写入发生冲突,并可能超过重试次数和失败。

如果更新大量行,COW 是理想的选择。但是,如果只更新几行,仍然需要重写整个数据文件,这使得小的或频繁的更改变得昂贵。

在读取端ÿ

http://www.lryc.cn/news/63957.html

相关文章:

  • 双亲委派机制的原理和作用
  • mac免费杀毒软件哪个好用?如何清理mac系统需要垃圾
  • css 实现太极效果
  • 【前端基础知识】Vue中的变量不是响应式的吗?属性赋值后视图不变化的原因是什么?
  • 如何完全卸载linux下通过rpm安装的mysql
  • [渗透教程]-004-长城防火墙GFW的原理
  • LaTeX基础文本排版命令
  • PLC模糊控制模糊PID(梯形图实现+算法分析)
  • 线程池在Java多线程中的应用
  • 1997-2021年全国30省技术市场成交额(亿元)
  • 【C++】面向对象之多态
  • 卡尔曼滤波器简介——多维卡尔曼滤波
  • 如何用 GPT-4 帮你写游戏?
  • R语言的贝叶斯时空数据模型实践技术应用
  • Lazysysadmin靶机渗透过程
  • 为什么网络安全缺口很大,招聘却很少?
  • SpringBoot手册
  • 【Linux】如何实现单机版QQ,来看进程间通信之管道
  • 从一到无穷大 #6 盘满排查过程
  • ChatGPT技术原理 第九章:数据集和训练技巧
  • NCR被攻击后服务中断!原是BlackCat勒索软件作祟
  • 带你认识什么是BMS(电池管理系统)
  • 安装Ubuntu22.04虚拟机的一些常见问题解决方法
  • 银河麒麟操作系统,安装Gitlab 基于docker
  • 基于Python实现个人手机定位分析
  • Unity Navgation系统杂记
  • [2021.11.9]lighteffect架构优化详细设计文档
  • 经典回归算法
  • Python两三行代码轻松批量添加~防韩还是很有必要的~
  • 开心消消乐