当前位置: 首页 > news >正文

Hive默认分割符、存储格式与数据压缩

目录

    • 1、Hive默认分割符
    • 2、Hive存储格式
    • 3、Hive数据压缩


1、Hive默认分割符


Hive创建表时指定的行受限(ROW FORMAT)配置标准HQL为:

...
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\u0001'
COLLECTION ITEMS TERMINATED BY ','
MAP KEYS TERMINATED BY ':'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
TBLPROPERTIES ('key'='value')
LOCATION '/user/hive/warehouse/...'

Hive默认分割符规则如下:

分隔符受限项HQL语法
^A(\001)字段(列)分隔符FIELDS TERMINATED BY
^B(\002)集合(array、struct、map)元素(map为键值对)间的分隔符COLLECTION ITEMS TERMINATED BY
^C(\003)map元素键与值间的分隔符MAP KEYS TERMINATED BY
\n行分隔符LINES TERMINATED BY

2、Hive存储格式


Hive支持的存储数据的格式主要有:TEXTFILE(行式存储) 、SEQUENCEFILE(行式存储)、ORC(列式存储)、PARQUET(列式存储)。企业中使用ORC较多

更多关于存储格式的介绍见:https://www.cnblogs.com/jimmy888/p/13551605.html

3、Hive数据压缩


Hive的数据压缩格式通过TBLPROPERTIES关键字指定

SNAPPY压缩在企业中使用较多

1) ORC存储格式的SNAPPY压缩:

STORED AS ORC
TBLPROPERTIES ("orc.compress"="SNAPPY")

2) PARQUET存储格式的SNAPPY压缩:

STORED AS PARQUET
TBLPROPERTIES ("parquet.compression"="SNAPPY")

更多关于数据压缩的介绍见:https://www.cnblogs.com/jimmy888/p/13551605.html


http://www.lryc.cn/news/237218.html

相关文章:

  • update_engine-FilesystemVerifierAction和PostinstallRunnerAction
  • 深度学习乳腺癌分类 计算机竞赛
  • 【Python百宝箱】掌握Python Web开发三剑客:Flask、Django、FastAPI一网打尽
  • 【人工智能时代的刑法体系与责任主体概述】
  • 透视maven打包编译正常,intellj idea编译失败问题的本质
  • npm报错
  • 【FFmpeg实战】ffmpeg播放器-音视频解码流程
  • 基于SSM的高校毕业选题管理系统设计与实现
  • 一个简单的Oracle Redaction实验
  • getchar函数的功能有哪些
  • 信息机房监控系统(动环辅助监控系统)
  • 最强英文开源模型Llama2架构与技术细节探秘
  • 编程刷题网站以及实用型网站推荐
  • 基于STC12C5A60S2系列1T 8051单片机的SPI总线器件数模芯片TLC5615实现数模转换应用
  • 【并发编程】Synchronized的使用
  • 【Python】Python基础
  • gitlab环境准备
  • Apache Doris (五十四): Doris Join类型 - Bucket Shuffle Join
  • 【AI】行业消息精选和分析(23-11-20)
  • Matplotlib实现Label及Title都在下方的最佳姿势
  • 使用 uWSGI 部署 Django 应用详解
  • MyBatis在注解中使用动态查询
  • 百云齐鲁 | 云轴科技ZStack成功实践精选(山东)
  • 【Electron】electron-builder打包失败问题记录
  • OpenCV快速入门:直方图、掩膜、模板匹配和霍夫检测
  • HDD与QLC SSD深度对比:功耗与存储密度的终极较量
  • 医疗软件制造商如何实施静态分析,满足 FDA 医疗器械网络安全验证
  • 【设计模式】聊聊策略模式
  • 二维偏序问题
  • 解析Spring Boot中的CommandLineRunner和ApplicationRunner:用法、区别和适用场景详解