当前位置: 首页 > news >正文

大数据之Hudi数据湖_大数据治理_简介_发展历史_特性_应用场景---大数据之Hudi数据湖工作笔记0001

支持hive spark flink

美国公司开发的~

 

都在使用,这些企业都在用

支持hadoop的,更新,插入,删除 和数据增量处理

支持流式数据处理.

hive是离线数仓

hive不支持事物 insert overwrite 底层后来通过这种方式支持了事物

insert overwrite处理数据很低效,因为更新是基于覆盖实现的

.parquet .avro这两种数据格式,

这个支持流处理,也支持批处理~

可以实时获取流数据,提供了事物...都是解决大数据处理的痛点的.

然后会把一个个小文件进行合并,这里也称为压缩~

hudi可以把很多大数据框架集合起来,做更好的处理

 

http://www.lryc.cn/news/26176.html

相关文章:

  • 射频功率放大器基于纵向导波的杆状构件腐蚀诊断方法的研究
  • Leedcode 二分查找 理解1
  • 【告别篇】大家好,再见了,我转行了,在筹备创业
  • Java——岛屿数量
  • 《代码整洁之道》笔记
  • 个人网站如何集成QQ快捷登录功能?
  • 从工厂打螺丝到月薪18k测试工程师,我该满足吗?
  • 【相关分析-高阶绘图】MATLAB实现皮尔逊相关分析-散点直方图
  • Spark性能优化二 Shuffle机制分析
  • 软测入门(四)Appium-APP移动测试基础
  • 华为OD机试用Python实现 -【集五福】 |老题且简单
  • Typro使用以及安装教程来啦
  • 武汉凯迪正大KD305系列智能数字绝缘电阻测试仪
  • 如何使用码匠连接 Redis
  • 防止网络攻击的10大网络安全措施
  • LeetCode 面试题 05.02. 二进制数转字符串
  • [MatLab]图像绘制
  • datax导入到hive的数据量翻倍
  • 拿下3个大厂offer的软件测试面试宝典,面试一文搞定
  • 长短记忆神经网络(LSTM,Long Short-Term Memory)
  • Makefile学习2
  • 【字符串】leetcode28. 实现 strStr()(C/C++/Java/Python/Js)
  • 游戏开发是个“坑”,而且是个“天坑”
  • 剑指 Offer 64. 求 1 + 2 + … + n(java解题)
  • 2022 年度_职业项目总结_Java技术点归纳
  • 【项目实战】32G的电脑启动IDEA一个后端服务要2min,谁忍的了?
  • 接口自动化面试题汇总(持续更新)
  • SpringBoot实现静态资源映射,登录功能以及访问拦截验证——以黑马瑞吉外卖为例
  • PythonWeb Django PostgreSQL创建Web项目(三)
  • 【Visual Studio】git提交代码时使用GPG