当前位置: 首页 > news >正文

MapReduce编程规范

MapReduce编程规范

MapReduce的开发一共有八个步骤,其中Map阶段分为2个步骤,Shuffle阶段4个步骤,Reduce阶段分为2个步骤。

  • Map阶段2个步骤
  1. 设置InputFormat类,将数据切分为Key-Value(K1和V1)对,输入到第二步。

  2. 自定义Map逻辑,将第一步的结果转换成另外的 Key-Value (K2,V2)对,输出结果

  • Shuffle阶段4个步骤
  1. 对输出的Key-Value对进行分区

  2. 对不同分区的数据按照相同的 Key排序

  3. (可选)对分组过的数据初步规约,降低数据的网络拷贝

  4. 对数据进行分组,相同Key的value放入一个集合中

  • Reduce阶段2个步骤
  1. 对多个Map任务的结果进行排序以及合并,编写Reduce函数实现自己的逻辑,对输入的Key-Value进行处理,转为新的Key-Value(K3和V3)输出

  2. 设置OutputFormat处理并保存Reduce输出的Key-vajue数据

http://www.lryc.cn/news/232.html

相关文章:

  • Unity 如何实现游戏Avatar角色头部跟随视角转动
  • 深度学习优化算法总结
  • CMake详细使用
  • 【数据结构与算法】前缀树的实现
  • canvas 制作2048
  • playwright: 全局修改页面等待超时时间
  • C++类和对象(中)
  • Docker安装EalasticSearch、Kibana,安装Elasticvue插件
  • 算法训练营 day39 贪心算法 无重叠区间 划分字母区间 合并区间
  • c/c++开发,无可避免的文件访问开发案例
  • MySQL学习笔记
  • ccs导入工程失败的处理方法
  • 探针台常见的故障及解决方法
  • 域内资源探测
  • c# 将数据导出到EXCEL文件
  • 微服务 分片 运维管理
  • 批量占满TEMP表空间问题处理与排查
  • Pytorch中的tensor和variable
  • 暗月内网渗透实战——项目七
  • 【Java 面试合集】描述下Objec类中常用的方法(未完待续中...)
  • SQLSERVER 的 truncate 和 delete 有区别吗?
  • 【C++】CC++内存管理
  • 数据预处理之图像去空白
  • 真的麻了,别再为难软件测试员了......
  • 2月9日,30秒知全网,精选7个热点
  • 球面坐标系下的三重积分
  • 谷歌 Jason Wei | AI 研究的 4 项基本技能
  • excel数据整理:合并计算快速查看人员变动
  • vit-pytorch实现 MobileViT注意力可视化
  • Python将字典转换为csv