当前位置: 首页 > news >正文

华为hcip-big data 学习笔记《一》大数据应用开发总指导

一、大数据应用开发总指导

1. 前言

随着大数据技术的飞速发展和大数据应用的不断普及,大数据已经成为当今时代最热门的话题之一。不过对于大数据的了解,很多人还只是停留在表面,提到大数据,很多人只是直到它是最新的科技,有很大的价值,对于它的主流技术和具体的解决方案可能没有过多的认知,本次课程将指引大家学习大数据主流技术和企业级大数据解决方案。

2. 目标

学完本章后,您将能够:

  • 了解大数据主流技术

  • 了解大数据场景化解决方案

  • 了解大数据应用开发

3. 发展

根据IBM前首席执政官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革。

信息化浪潮

发生时间

标志

解决问题

代表企业

第一次信息化浪潮

1980年前后

个人计算机

信息处理

Intel,AMD,IBM,苹果,微软,联想,戴尔,惠普等

第二次信息化浪潮

1995年前后

互联网

信息传输

雅虎、谷歌、阿里巴巴、百度、腾讯等

第三次信息化浪潮

2010年前后

物联网、云计算和大数据

信息爆炸

亚马逊、谷歌、IBM、Hortonworks、阿里云等

4.科技助力大数据时代到来

5.大数据的概念(4V)

大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。

6.三驾马车(Google发布的三篇论文)

大数据技术起源于Google在2004年前后发表的三篇论文,也就是我们经常听到的“三架马车”。

  • 分布式文件系统GFS

  • 大数据分布式计算框架MapReduce

  • 分布式数据块系统BigTable

7.大数据技术演变

8.大数据主流技术

所谓大数据技术,是指伴随大数据的采集、存储、处理和分析的相关技术

  • 数据采集

    • 使用Flume,可进行流式日志数据的收集

    • 使用Sqoop可以交互关系型数据库,进行导入导出数据

    • 使用爬虫技术,可在网上爬取海量网页数据。

  • 数据存储和管理

    • 大数据利用分布式文件系统HDFS、HBase、Hive,实现对结构化、半结构化和非结构化数据的存储和管理。

  • 数据处理与分析

    • 利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析。

http://www.lryc.cn/news/419799.html

相关文章:

  • 用户画像架构图
  • 37.x86游戏实战-XXX遍历怪物数组
  • go语言中map为什么不会自动初始化?
  • 大数据面试SQL(一):合并日期重叠的活动
  • stm32应用、项目、调试
  • WEB渗透-未授权访问篇
  • x86_64、AArch64、ARM32、LoongArch64、RISC-V
  • git push上不去的问题Iremote reiectedl——文件过大的问题
  • Qt Creator卡顿
  • 数据结构笔记(其五)--串
  • Python爬取高清美女图片
  • gin路由
  • 达梦数据库操作以及报错修改
  • 江科大/江协科技 STM32学习笔记P21
  • 第三方jar自带logback导致本地日志文件不生成
  • 国产数据库备份恢复实现
  • 数据仓库: 2- 数据建模
  • Tomcat 漏洞
  • 分布式消息队列Kafka
  • C# Unity 面向对象补全计划 七大原则 之 迪米特法则(Law Of Demeter )难度:☆☆☆ 总结:直取蜀汉
  • 【C++】—— 类与对象(四)
  • Qt无边框窗口,关闭后再show,鼠标等事件不响应问题解决办法
  • StringJoiner更优雅创建含分隔符的字符序列
  • 线程池原理(一)线程池核心概述
  • 关于redisson的序列化配置
  • CentOS安装ax200驱动
  • FFMPEG Mac版本编译
  • Reactive Programing与“响应式”
  • Pinterest:从 Druid 到 StarRocks,实现 6 倍成本效益比提升
  • 代码+视频,R语言VRPM绘制多种模型的彩色列线图