当前位置: 首页 > news >正文

大数据技术基础

一、大数据平台

1.大数据平台方案步骤:

  ①市场上有哪些大数据平台

  ②硬件、系统、业务增长等方面

  ③方案是否通过

通过后:按照一期目标投入

先虚拟环境部署联系,再实际部署

《大数据架构介绍》《Hadoop架构解析》《Hadoop集群规划》

《Hadoop安装部署》,《实验:Hadoop集群搭建》

《Hadoop核心组件-HDFS》,《实验:HDFS查看元数据》《高可用HDFS》

十分的事情,完成十二分!!!比预期完成的更好

因为需求、业务需求,所以上大数据

2.数据库管理员 (DBA) 是指负责维护、保护和运营数据库,确保正确存储和检索数据的专业人员。

3.大数据:大量、多样、快速、价值密度低的数据

4.传统服务器架构:单机、主备、主从-----数据之间需要同步,例如:一人一本完整的书,得复印十本书

    现有服务器架构:分片式架构,将数据分散在多个节点,多个节点合成一个数据,例如:查找一本书中的页数,每10页分给一个人,合起来,就是页码数

二、主流大数据平台---Hadoop

1.Hadoop常用组件:

2.结构

主节点:领导,从节点:员工 

 

3.版本 

一版本无Yarn,只能通过MapReduce进行资源管理和数据处理,只有一个leader

二版本好处:以下三个好处 ---加入了yarn,有两个leader

 

4.运行模式 

三、集群-----不是某一个人的任务,而是一群人的任务

集群考虑:组件分配、硬件、虚拟化和节点配置等;

http://www.lryc.cn/news/401530.html

相关文章:

  • 【文心智能体】前几天百度热搜有一条非常有趣的话题《00后疯感工牌》,看看如何通过低代码工作流方式实现图片显示
  • C++20中的constinit说明符
  • Java 中的正则表达式
  • 华为配置蓝牙终端定位实验
  • 搭建hadoop+spark完全分布式集群环境
  • pytorch-pytorch之LSTM
  • jvm优化
  • 网络安全——防御课实验二
  • 朴素模式匹配算法与KMP算法(非重点)
  • [k8s源码]2.CURD deployment
  • 使用base64通用文件上传
  • Python深度学习
  • django报错(三):No crontab program或got an unexpected keyword argument ‘user’
  • 数据库(创建数据库和表)
  • Log4j的原理及应用详解(一)
  • ubuntu系统Docker常用命令
  • 韦东山嵌入式linux系列-驱动设计的思想(面向对象/分层/分离)
  • 0/1背包
  • Linux的进程和权限的基本命令
  • 鼠标录制工具怎么挑选?9款电脑鼠标录制工具分享(2024)
  • C1W4.LAB.Vector manipulation+Hash functions and multiplanes
  • YOLOv8改进 | 检测头 | 融合渐进特征金字塔的检测头【AFPN4】
  • 数据采集监控平台:挖掘数据价值 高效高速生产!
  • 【算法笔记自学】第 9 章 提高篇(3)——数据结构专题(2)
  • Objective-C 中字符串的保存位置
  • git 想要创建一个新的本地分支并检出远程分支的内容
  • C语言学习笔记[24]:循环语句while②
  • 安全运营概述
  • spring-cloud和spring-cloud-alibaba的关系
  • 持续集成06--Jenkins构建触发器