当前位置: 首页 > news >正文

中级数据开发工程师养成计

目标

工作之后就很少时间用来沉淀知识了,难得用空闲时间沉淀一下自己。
成为一名中级数据开发工程师。偏向于数据仓库,数据治理方向。

整体排期

1 hive
2 hadoop
3 flink
4 spark
5 闲杂工具 kafka maxwell cancal
6 数据建模(偏向于kimboll维度建模)
7 机器学习 --常见算法理论 简单应用
8 python编程 numpy pandas matplotlib等常用分析工具
9 ETL开发
10 shell 常规使用

1 Hive

概念:

acid :
atomicity 原子性: 要么全部成功,要么全部失败恢复如初
consistency : 一致性 :数据库保持完整性,不可能一个人账单
isolation 隔离性 :多并发的时候是否保持隔离
durability 持久性 :一旦更改成功,哪怕机器坏掉了数据页不会丢失
cap :
consistency 一致性 数据更新完后,所有的数据完全一致。
availability:可用性 任何节点都需要在一定时间完成。
partiton tolerance: 分区容错性
cap只能满足两个 ca的话传统数据库 ,mysql
cp的话 redis hbase这些
ap 的话,数据不一致就没办法了。 一般大数据都是谈cp,ap,如果没有p,就不要谈大数据了。
怎么说?CAP理论的C和ACID的C一致性含义不一样要记住哦。

http://www.lryc.cn/news/34971.html

相关文章:

  • fastjson 返回 $ref 数据
  • Zookeeper特性和节点数据类型详解
  • Java代码是如何被CPU狂飙起来的?
  • Dynamics365安装失败解决及注册编写
  • Kafka 集群参数
  • 等保2.0与1.0 测评要求的变化
  • nodejs学习巩固笔记-nodejs基础,Node.js 高级编程(核心模块、模块加载机制)
  • 2023年春【移动计算技术】文献精读(二)-3 || 附:创新点、创新思想和技术路线总结
  • 企业新闻稿的格式和要求是什么?如何写好新闻稿?
  • String类的底层原理和版本演变
  • 软考高级信息系统项目管理师系列之二十三:项目采购管理
  • SpringMVC-0308
  • [数据结构]:14-选择排序(顺序表指针实现形式)(C语言实现)
  • 基于C/C++综合训练 ----- 贪吃蛇
  • Unity 混合操作(Blending)
  • Hive建表高阶语句
  • 面向新时代,海泰方圆战略升级!“1465”隆重发布!
  • 带你感受一次JVM调优实战
  • ALG和STUN
  • 原生HTML放大镜
  • C++——模板
  • Chapter2.1:线性表基础
  • Spring源码解析-Spring 循环依赖
  • 从零开始学架构——架构设计的目的
  • Python 异步: 异步生成器(16)
  • .net6 web api使用EF Core,根据model类自动生成表
  • 计算机科学导论笔记(五)
  • 通过命令打Java可执行jar包
  • java基础系列(九) 接口和抽象类
  • Docker启动问题docker is starting…