当前位置: 首页 > news >正文

自学大数据的第一天

在这里插入图片描述

默认跳过基础部分,直接搞集群的部分,期间用到的linux基础默认大伙都会了(不会的话可以现用现查)

Hadoop集群搭建

集群特点:

1,逻辑上分离~集群之间没有依赖,互不影响
2,某些进程往往部署在一台服务器上,但是属于不同的集群
3,MapReduce 是计算框架,代码层面的处理逻辑

集群的搭建

集群角色的规划:

  1. 根据软件工作特性跟服务器硬件资源来做分配
  2. 资源上有冲突的尽量不要部署在一起
  3. 工作上相互配合的,尽量部署在一起

服务器基础环境准备

研究一下官网给的教程:

需要 java环境

因为hadoop是根据java语言编写的,所以需要java环境支持
安装java环境过程略
在这里插入图片描述hadoop不同的版本是对java版本有一定要求的

支持的 Java 版本

Apache Hadoop 3.3 及更高版本支持 Java 8 和 Java 11(仅限运行时)
请使用Java 8编译Hadoop。不支持使用 Java 11 编译 Hadoop: HADOOP-16795 - Java 11 编译支持 打开
Apache Hadoop 从 3.0.x 到 3.2.x 现在仅支持 Java 8
Apache Hadoop 从 2.7.x 到 2.10.x 同时支持 Java 7 和 8

ssh加密

安装openssh-client 和 openssh-server

过程略
在这里插入图片描述

配置hadoop的环境参数

下载hadoop压缩包

在这里插入图片描述
这里选择稳定的版本 stable2

wget  https://dlcdn.apache.org/hadoop/common/stable2/hadoop-2.10.2.tar.gz

下载后解压

 tar -zxf hadoop-2.10.2.tar.gz

在这里插入图片描述

编辑配置文件

在这里插入图片描述在配置文件中我们可以看到需要我们 配置java_home

root@Gavin:/usr/local/hadoop-2.10.2/etc/hadoop# vi hadoop-env.sh
root@Gavin:/usr/local/hadoop-2.10.2/etc/hadoop# export JAVA_HOME=/usr/local/java/jdk11
root@Gavin:/usr/local/hadoop-2.10.2/etc/hadoop# java -version
openjdk version "1.8.0_352"
OpenJDK Runtime Environment (build 1.8.0_352-8u352-ga-1~20.04-b08)
OpenJDK 64-Bit Server VM (build 25.352-b08, mixed mode)
root@Gavin:/usr/local/hadoop-2.10.2/etc/hadoop# javac -version
javac 1.8.0_352

准备启动hadoop集群

hadoop支持三种模式启动

本地(独立)模式

先来一个本地启动吧

默认情况下,hadoop配置为非分布式模式下运行,作为单个的java 进程,这对于调试很有用,因为默认的打包并不适合所有的场景,企业一般需要自己订制(所以企业也不会像我这样直接下载打包好的tar包使用,而是直接下载源码进行适当修改后在编译;

按照惯例先看帮助文档
在这里插入图片描述

root@Gavin:/usr/local/hadoop-2.10.2# mkdir input
root@Gavin:/usr/local/hadoop-2.10.2# cp etc/hadoop/*.xml input
root@Gavin:/usr/local/hadoop-2.10.2# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.2.jar grep inp
ut output 'dfs[a-z]+'

最后的结果~
在这里插入图片描述 不知道是否正确,按照目前的情况来看,之前是没有input 和output 文件夹的

MapReduce的运作模式~大致如下
在这里插入图片描述

伪分布式操作

配置核心的参数
在这里插入图片描述

找到以下文件

etc/hadoop/core-site.xml:

在这里插入图片描述

etc/hadoop/hdfs-site.xml:

在这里插入图片描述
未完待续,先看看理论在继续

http://www.lryc.cn/news/21021.html

相关文章:

  • redis秒杀
  • JS学习第3天——Web APIs之DOM(什么是DOM,相关API【创建、增删改查、属性操作、事件操作API】)
  • 【MySQL】增删改操作(基础篇)
  • STM32—DMA
  • C语言刷题(3)——“C”
  • 搭建Vue工程
  • C语言汉诺塔问题【图文详解】
  • 1、RocketMQ概述
  • 【POJ 3352】Road Construction 题解(Tarjan算法求边双连通分量缩点)
  • Python—单分支结构
  • rabbitmq添加用户,虚拟机步,设置rabbitmq配置文件
  • Codeforces Round#853 div2 A-C
  • 软考之操作系统知识
  • 【线性代数/计算复杂性理论】积和式的指数时间算法:Ryser算法
  • 代码随想录 NO52 | 动态规划_leetcode 647. 回文子串 516.最长回文子序列
  • 【数据挖掘】1、综述:背景、数据的特征、数据挖掘的六大应用方向、有趣的案例
  • 【架构师】零基础到精通——康威定律
  • Could not extract response: no suitable HttpMessageConverter
  • 文献计量三大定律之一---洛特卡定律及普赖斯定律
  • 2023年软考高级网络规划设计师
  • 数据治理驱动因素 -报考题
  • 2023淘宝天猫38节红包满减优惠活动时间是从几月几号什么时候开始?
  • Hive表优化、表设计优化、Hive表数据优化(ORC)、数据压缩、存储优化
  • LearnOpenGL-入门-着色器
  • 【谷粒学院】vue、axios、element-ui、node.js(44~58)
  • 【一些回忆】2022.02.26-2023.02.26 一个普通男孩的365天
  • OSPF的多区域特性 (电子科技大学TCP/IP实验三)
  • (四十四)多个事务更新同一行数据时,是如何加锁避免脏写的?
  • 【数据库】第十二章 数据库管理
  • Redis源码---整体架构