当前位置: 首页 > news >正文

Hadoop架构、Hive相关知识点及Hive执行流程

Hadoop架构

Hadoop由三大部分组成:HDFS、MapReduce、yarn

HDFS:负责数据的存储

其中包括:

        namenode:主节点,用来分配任务给从节点

        secondarynamenode:副节点,辅助主节点

        datanode:从节点,负责实际的存储

MapReduce:负责计算

其中Map负责分解,reduce负责合并

yarn:负责资源调度

其中包括:

        resourcemanager:负责接收用户的请求,并负责集群的管理和资源调度

        nodemanager:负责执行resourcemanager分配的任务


Hive相关知识点

元数据:用来描述数据的数据。

元数据包含:用Hive创建的database、table、表的字段等元信息。

元数据存储:存在关系型数据库中,如:hive内置的Derby数据库或者第三方MySQL数据库等,一般使用Mysql数据库。

Metastore:即元数据存储服务

作用是: 客户端连接metastore服务,metastore再去连接MySQL等数据库来存取元数据。

特点: 有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL等数据库的用户名和密码,只需要连接metastore 服务即可。


Hive执行流程

 1.用户在用户端编写sql语句,通过hive thrift server传到hive

hive中:

2.解析器:解析sql语法

3.编译器:将sql语句编译成MapReduce程序,通过metastore在数据库中获取元数据并映射成一张表

优化器:优化MapReduce程序

4.执行器:将优化后的执MapReduce程序传给Hadoop

Hadoop来执行MapReduce程序,yarn复制资源调度,MapReduce负责计算

5.hive来监督执行情况,Hadoop会将结果存在hdfs中

6.结果返回显示

http://www.lryc.cn/news/225254.html

相关文章:

  • P1529 [USACO2.4] 回家 Bessie Come Home 题解
  • Python语法基础(条件语句 循环语句 函数 切片及索引)
  • Debian 9 Stretch APT问题
  • 遍历List集合和Map进行修改和删除报java.util.ConcurrentModificationException错误详解
  • Android从一个APP跳转到另外一个APP
  • 我的创作纪念日——创作者2年
  • 大数据之LibrA数据库系统告警处理(ALM-12032 ommdba用户或密码即将过期)
  • C_3练习题
  • CentOS7 安装Jenkins 2.414.3 详细教程
  • chatglm3-6b记录问答对
  • k8s ingress 代理 mysql 3306端口
  • Informix管理共享内存
  • Webpack 中 Plugin 的作用是什么?常用 plugin 有哪些?
  • CSRF(跨站请求伪造)攻击演示
  • 图解三傻排序 选择排序、冒泡排序、插入排序
  • 【数据结构】树与二叉树(六):二叉树的链式存储
  • 后端Java日常实习生面试(2023年11月10日)
  • 使用iperf3在macOS上进行网络性能测试
  • 09-MySQL主从复制
  • virtualBox虚拟机局域网访问配置
  • IDEA高效编程快捷键
  • nginx实现vue和后端的双机负载
  • ARMday03(寄存器读写、栈、程序状态寄存器、软中断和异常、混合编程)
  • Excel中功能区的存放位置很灵活,可以根据需要隐藏或显示
  • HelloGitHub 社区动态,开启新的篇章!
  • 【学术综述】-如何写出一篇好综述-写好综述要注意的问题
  • ClickHouse介绍和使用
  • 数码管动态扫描
  • Webpack 中 loader 的作用是什么?常用 loader 有哪些?
  • c#,字段和属性的区别