当前位置: 首页 > news >正文

01.hadoop上课笔记之hadoop介绍

1.大数据介绍

  1. 可以对未来数据预测 google通过搜索预测流感,足球球员有一 定关联…
  2. caict可以得到数据
  3. hbase hive林子雨mooc
  4. 数据要进行挖掘(推断更多信息)

2.大数据是非结构化数据多:声音,图片…

3.大数据影响因素 大多快低 tb pb eb zb

1.硬件
2.网络带宽

4.大数据的特征

  1. 数据量大
  2. 数据格式多样
  3. 速度快 秒级实时响应
  4. 低价值密度

5.大数据的影响

  1. 数据多,抽样不能表达所有全样(全部数据) 如灯泡检测,用以前灯泡检测数据,进行分析它的 趋势
  2. 效率而非精确(数据中不一定是准确的,预测一瞬间的数据)
  3. 相关而非因果(相关性,有关联, 啤酒和尿布,因为因果很难知道去发现…)

6.大数据的应用领域

银行 做信贷风险分析(贷不贷款给他)
汽车 无人驾驶 判断是否遇到障碍
零售 商品推荐
餐饮 麦当劳的选址 我们的手机通讯商发现人流量多,卖信息给麦当劳
上海迪士尼 发手环,定位你,送餐给你避免餐厅拥挤

7.hadoop是他孩子的黄色的小象

hadoop 2008年出名 10亿数据排序 打破世界纪录 雅虎 腾讯 阿里(使用商业版) facebook 百度 淘宝使用
hadoop特性 高可靠性高效性 高可扩展性 高容错性 成本低 (加社区,面试有用) (如 spark在内存里面计算)

http://www.lryc.cn/news/90681.html

相关文章:

  • 小鹏汽车Q1财报:押注G6、大力降本,明年智驾BOM降半
  • VMware ESXi 8.0U1a 发布 - 领先的裸机 Hypervisor
  • Unity的IPreprocessBuild:深入解析与实用案例
  • htmlCSS-----CSS选择器(下)
  • RDK X3 Module发布,全新软硬件平台加速实现量产级产品落地
  • 【面试实战】Redis缓存设计
  • 如何解决js定时器不准确问题
  • 学习笔记——vue中使用el-dropdown组件报错
  • Java之旅(八)
  • 华为OD机试真题(Java),四则运算(100%通过+复盘思路)
  • HTML表单标签form分析
  • Qt 项目文件Pri详解
  • Keil 5 MDK 发律师函警告了,如何用STCubeIDE开发标准库的程序(STM32F103C8T6为例)
  • 接口测试--apipost接口断言详解
  • YYDS练手 130道python练习题 完整版PDF
  • 2-python的变量类型
  • Python之并发编程一背景知识
  • Redis分区
  • 代码随想录算法训练营第56天 | 583、72
  • c++输入输出文件操作stream
  • 【小呆的力学笔记】非线性有限元的初步认识【三】
  • python计算闰年
  • 聊聊如何使用Js写一个简单的二级联动和三级联动呢?
  • IPv4 和 IPv6 的特点、区别以及在互联网中的应用
  • JavaScript处理移动web交互
  • 4年测试经验,一问三不知,过于离谱...
  • Java 与查找算法(2)二分查找
  • Java程序设计入门教程--原始类与包装类
  • pip安装python库速度慢、失败及超时报错解决办法
  • 向量数据库