当前位置: 首页 > news >正文

【Hadoop|MapReduce篇】Hadoop序列化概述

1. 什么是序列化

序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。

反序列化就是将收到的字节序列(或其他数据传输协议)或者磁盘的持久化数据,转换成内存中的对象。

2. 为什么要序列化

一般来说,“活的”对象只生存在内存中,关机断电就没有了。而且活的对象只能由本地的进程使用,不能被发送到网络上的另外一台计算机。然后序列化可以存储“活的”对象,可以将“活的”对象发送到远程计算机。

3. 为什么不用java序列化

java序列化是一个重量级序列化框架(Serializable),一个对象被序列化后,会附带很多额外的信息(各种校验信息,Header,继承体系等),不便于在网络中高效传输。而hadoop的序列化只是会附带简单的校验,紧凑存储空间少,快速传输速度块。互操作性好。

http://www.lryc.cn/news/435323.html

相关文章:

  • 【Elasticsearch系列】Elasticsearch中的分页
  • NLTK:一个强大的自然语言处理处理Python库
  • NUUO网络视频录像机 css_parser.php 任意文件读取漏洞复现
  • 【支付】Stripe支付通道Java对接(产品 价格 支付 查询 退款 回调)
  • Unity3D 小案例 像素贪吃蛇 01 蛇的移动
  • 【STM32 MCU】stm32MCUs 32-bit Arm Cortex-M
  • html+css网页设计 旅游 雪花旅行社5个页面
  • vue3中的实例
  • 9.测试计划(包含笔试/面试题)
  • 这 7 款AI应用将让你全新的iPhone 16成为电影制作的强大工具
  • 自注意力机制(self-attention)
  • Nuxt3入门:过渡效果(第5节)
  • 【开发工具】IntelliJ IDEA插件推荐:Json Helper——让JSON处理更高效
  • Lua垃圾回收机制
  • Java学习路线:详细指引
  • 商家转账到零钱如何开通-微信支付
  • 自研商家如何快速接入电商平台订单数据?
  • Win10下借助CMake编译OpenMVS
  • 04_定时器与数码管基础
  • Python 数学建模——方差分析
  • 计算机视觉中,什么是上下文信息(contextual information)?
  • YOLOv5改进 | 模块缝合 | C3 融合RVB + EMA注意力机制【二次融合】
  • mysql 更改默认端口号 新增用户密码 赋予权限
  • 吐血整理nacos 作为springcloud的配置中心和注册中心
  • 【秋招笔试】9.09阿里国际秋招(已改编)-三语言题解
  • sql语句在sqlserver中能查询出结果,但是代码中查不出来
  • 【机器学习】决策树与随机森林:模型对比与应用案例分析
  • Apache SeaTunnel基础介绍
  • 阿里旗下土耳其电商Trendyol计划进军欧洲市场
  • IBM中国研发裁员与AIGC浪潮下的中国IT产业新篇章:挑战、机遇与未来展望