当前位置: 首页 > article >正文

Hadoop大数据平台

一、hadoop简介

Hadoop起源于Google的三大论文:

  • GFS:Google的分布式文件系统Google File System
  • MapReduce:Google的MapReduce开源分布式并行计算框架
  • BigTable:一个大型的分布式数据库

演变关系:

  • GFS—->HDFS
  • Google MapReduce—->Hadoop MapReduce
  • BigTable—->HBase

Hadoop名字不是一个缩写,是Hadoop之父Doug Cutting儿子毛绒玩具象命名的。

hadoop主流版本:

  • Apache基金会hadoop
  • Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称“CDH”)
  • Hortonworks版本(Hortonworks Data Platform,简称“HDP”)

在这里插入图片描述
Hadoop的框架最核心的设计就是:HDFS和MapReduce。

  • HDFS为海量的数据提供了存储。
  • MapReduce为海量的数据提供了计算。

Hadoop框架包括以下四个模块:

  • Hadoop Common: 这些是其他Hadoop模块所需的Java库和实用程序。这些库提供文件系统和操作系统级抽象,并包含启动Hadoop所需的Java文件和脚本。
  • Hadoop YARN: 这是一个用于作业调度和集群资源管理的框架。
  • Hadoop Distributed File System (HDFS): 分布式文件系统,提供对应用程序数据的高吞吐量访问。
  • Hadoop MapReduce:这是基于YARN的用于并行处理大数据集的系统。

hadoop应用场景:
在线旅游
移动数据
电子商务
能源开采与节能
基础架构管理
图像处理
诈骗检测
IT安全
医疗保健

二、部署

get hadoop-3.2.1.tar.gz jdk-8u171-linux-x64.tar.gz
[root@server1 ~]# useradd -u 1001 hadoop
[root@server1 ~]# mv * /home/hadoop/
[root@server1 ~]# su - hadoop 
[hadoop@server1 ~]$ tar zxf hadoop-3.2.1.tar.gz 
[hadoop@server1 ~]$ tar  zxf jdk-8u171-linux-x64.tar.gz 
[hadoop@server1 ~]$ ln -s jdk1.8.0_171/ java
[hadoop@server1 ~]$ ln -s hadoop-3.2.1 hadoop
[hadoop@server1 ~]$ cd hadoop
[hadoop@server1 hadoop]$ cd etc/hadoop/
[hadoop@server1 hadoop]$ vim hadoop-env.sh 
[hadoop@server1 ~]$ cd hadoop
[hadoop@server1 hadoop]$ mkdir input
[hadoop@server1 hadoop]$ cp etc/hadoop/*.xml input
[hadoop@server1 hadoop]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar grep input output 'dfs[a-z.]+'
[hadoop@server1 hadoop]$ cat output/*
1	dfsadmin
[hadoop@server1 ~]$ cd hadoop/etc/hadoop/
[hadoop@server1 hadoop]$ vim core-site.xml
<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>
</configuration>
[hadoop@server1 hadoop]$ vim hdfs-site.xml
<configuration><property><name>dfs.replication</name><value>1</value></property>
</configuration>
[hadoop@server1 ~]$ cd hadoop
[hadoop@server1 hadoop]$ bin/hdfs namenode -format
vim ~/.bash_profile 
source ~/.bash_profile
[hadoop@server1 ~]$ hdfs dfs -mkdir -p /user/hadoop
[hadoop@server1 hadoop]$ hdfs dfs -put input

网页访问:172.25.3.1:9870查看上传结果
在这里插入图片描述

[root@server1 ~]# echo westos | passwd --stdin hadoop
[hadoop@server1 hadoop]$ ssh-keygen
[hadoop@server1 hadoop]$ ssh-copy-id localhost
[hadoop@server1 hadoop]$ bin/hdfs namenode -format
[hadoop@server1 hadoop]$ cd sbin/
[hadoop@server1 sbin]$ ./start-dfs.sh
[hadoop@server1 hadoop]$bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar wordcount input output
[hadoop@server1 hadoop]$ hdfs dfs -ls input
[hadoop@server1 hadoop]$ hdfs dfs -cat output/*

在这里插入图片描述

[hadoop@server1 sbin]$ ./stop-dfs.sh 
[root@server1 ~]# yum install nfs-utils.x86_64 -y
[root@server1 ~]# vim /etc/exports
[root@server1 ~]# systemctl start nfs
[root@server2 ~]# yum install -y nfs-utils     #server3同样操作
[root@server2 ~]# useradd -u 1001 hadoop
[root@server2 ~]# showmount -e 172.25.3.1
Export list for 172.25.3.1:
/home/hadoop *
[root@server2 ~]# mount 172.25.3.1:/home/hadoop/ /home/hadoop/
[hadoop@server2 ~]$ jps
14426 Jps
14335 DataNode

[root@server1 ~]# su - hadoop
[hadoop@server1 ~]$ cd hadoop
[hadoop@server1 hadoop]$ cd etc/hadoop/
[hadoop@server1 hadoop]$ vim core-site.xml 
<configuration><property><name>fs.defaultFS</name><value>hdfs://server1:9000</value></property>
</configuration>
[hadoop@server1 hadoop]$ vim workers 
server2
server3
[hadoop@server1 hadoop]$ vim hdfs-site.xml
<configuration><property><name>dfs.replication</name><value>2</value></property>
</configuration>
[hadoop@server1 hadoop]$ bin/hdfs namenode -format
[hadoop@server1 ~]$ cd hadoop
[hadoop@server1 hadoop]$ cd sbin/
[hadoop@server1 sbin]$ ./start-dfs.sh 
[hadoop@server1 sbin]$ jps
19218 NameNode
19442 SecondaryNameNode
19562 Jps

在这里插入图片描述

[hadoop@server1 hadoop]$ hdfs dfs -mkdir -p /user/hadoop/
[hadoop@server1 hadoop]$ hdfs dfs -mkdir input
[hadoop@server1 hadoop]$ hdfs dfs -put * input

在这里插入图片描述
热添加:

[root@server4 ~]# yum install nfs-utils -y
[root@server4 ~]# useradd -u 1001 hadoop
[root@server4 ~]# mount 172.25.3.1:/home/hadoop/ /home/hadoop/
[root@server4 ~]# su - hadoop
[hadoop@server1 hadoop]$ vim workers
server2
server3
server4
[hadoop@server4 hadoop]$ hdfs --daemon start datanode

在这里插入图片描述
在这里插入图片描述
上传测试:

[hadoop@server4 ~]$ hdfs dfs -put jdk-8u171-linux-x64.tar.gz

在这里插入图片描述

节点删除

[hadoop@server1 hadoop]$ vim hdfs-site.xml 
<configuration><property><name>dfs.replication</name><value>2</value></property><property><name>dfs.hosts.exclude</name><value>/home/hadoop/hadoop/etc/hadoop/dfs.hosts.exclude</value></property><property><name>dfs.hosts</name><value>/home/hadoop/hadoop/etc/hadoop/dfs.hosts</value></property>
</configuration>
[hadoop@server1 sbin]$ ./stop-dfs.sh
[hadoop@server1 sbin]$ ./start-dfs.sh
[hadoop@server1 hadoop]$ vim workers 
server2
server3
server4
[hadoop@server1 hadoop]$ vim dfs.hosts.exclude 
server3
[hadoop@server1 hadoop]$ vim dfs.hosts
server2
server3
server4

在这里插入图片描述

http://www.lryc.cn/news/2418197.html

相关文章:

  • PCB SI仿真流程
  • Keil报错ST-LINK USB communication error解决方法
  • 网站SEO优化部分原则
  • AI 旅行工具大盘点!31 款 AI 旅行行程规划工具,一键规划旅行路线!
  • PHP+MySQL制作简单动态网站(附详细注释+源码)
  • 单片机加解密原理
  • 【Java】Java的基础入门学习
  • 注意,你注册的假1024可能就是它
  • CDLinux制作U盘启动
  • Delphi控件SPComm改造为Lazarus版本的问题
  • display:block的作用
  • web前端——给某网站移动版主页的体育板块进行布局设计
  • 目前数字人经济大火,但数字人价格成本昂贵,那么数字人免开会员怎么无限时长制作,数字人怎么批量自动生成视频源码开发技术
  • deepnode处理过的图片_微信图文排版用什么软件?文章图片大小不一样排版不齐怎么办?...
  • Hive sql 中 over 总结
  • 内部错误 (com.intellij.util.io.PersistentEnumeratorBase$VersionUpdatedException):
  • MBTI职业性格测试小程序
  • spring-boot-starter-actuator访问/actuator/info报404错误
  • 《GhostXP_SP2电脑公司特别版_8.0》
  • win7 梦幻桌面下载地址
  • 【ComfyUI】爽玩必备!6大插件汇总推荐
  • python用于人工智能的例子,python人工智能有趣例子
  • Installshield2008教程
  • Linux和PHP 开发参考消息 php博文+Linux镜像+http服务器+存储技术+框架+视频+好书+通信...
  • Rootkit
  • 在 ubuntu10.04下 载 android源码 步骤
  • E购通的商城系统
  • nutch 【配置与运行】
  • iptables端口转发配置实现
  • 分享88个搜索链接PHP源码,总有一款适合你