当前位置: 首页 > news >正文

L1 项目概述与Hadoop部署

1.技术栈:Hadoop+Hive+Sqoop+Flume+Azkaban

在这里插入图片描述
在这里插入图片描述

  • Flume采集Nginx web服务器上的日志,采集完成后存储到Hadoop的平台,最终存储到HDFS上,处理和分析采用Hive的方式,处理完之后利用Sqoop导出到Mysql中,最终利用一个JavaWeb的程序进行展现。
  • 使用技术:
  • 数据平台:Hadoop
  • 数据处理分析:Hive
  • 后端服务:SpringBoot + MyBatis
  • 数据可视化:Vue+Echarts
  • 数据迁移:Sqoop
  • 日志采集:Flume
    Hadoop 为用户提供了一个分布式基础架构,核心一个是HDFS分布式文件存储平台,一个是MapReduce。
  • HDFS文件系统原理

在这里插入图片描述

  • Namenode 记录原信息的路径信息
  • Datanodes 存数据的

MapReduce对数据进行处理:切片,以键值对的方式来存储

在这里插入图片描述

  • 分割
  • 建立新键值对
  • 合并相同的值为一个列表

在这里插入图片描述

  • Spark 实时计算引擎
  • Flume 数据采集
  • Sqoop 数据传输与MySql

课程主要精力放在项目流程搭建,工具的使用,业务逻辑分析上

项目部署

采用伪分布式的形式,一台机器模拟多台机器,

部署完成

在这里插入图片描述

http://www.lryc.cn/news/167108.html

相关文章:

  • 关键词文章生成器-标题文章生成器
  • 深入了解MySQL中的JSON_ARRAYAGG和JSON_OBJECT函数
  • Ubuntu22.04开启后屏幕黄屏
  • 华为云云耀云服务器L实例评测 | 搭建docker环境
  • exesql=“UPDATE test set date=‘%s‘“ % date 是啥意思
  • 请体验一下falcon 180b 大语言模型的感觉
  • 今晚8点,iPhone15开启预售
  • Meetup 回顾|Data Infra 研究社第十五期(含资料发布)
  • I2S/PCM知识点记录
  • 微信小程序——使用 Vant 组件实现 Popup 弹出层(各位置弹出详细代码分享)
  • linux查看python的py文件的命令
  • 开源库源码分析:Okhttp源码分析(一)
  • 无涯教程-JavaScript - LOOKUP函数
  • 这所院校太好考了!地处魔都!不要错过!
  • Python - PyQt6、QDesigner、pyuic5-tool 安装使用
  • C语言——指针进阶(三)
  • 三勾商城(java+vue3)微信小程序商城+SAAS+前后端源码
  • 【洁洁送书第七期】现在学 Java 找工作还有优势吗
  • npm发布自定义vue组件库
  • 9.12 C++作业
  • 利用LinuxPTP进行时间同步(软/硬件时间戳) - 研一
  • 《极客时间:左耳听风——程序员练级攻略》【文章笔记个人思考】
  • Springboot 实践(15)spring config 配置与运用—自动刷新
  • FirmAFL
  • SpringMVC的整合完成CRUD(增删改查)
  • Postman使用_Tests Script(断言测试)
  • 问道管理:华为概念股捷荣技术13天10板,监管质疑迎合热点炒作
  • VR云游:让游客足不出户享受旅行的乐趣
  • vue3学习源码笔记(小白入门系列)------ 重点!响应式原理 代码逐行分析
  • 62、SpringBoot 使用RestTemplate 整合第三方 RESTful 服务