当前位置: 首页 > news >正文

Hive数据定义(1)

        hive数据定义是hive的基础知识,所包含的知识点有:数据仓库的创建、数据仓库的查询、数据仓库的修改、数据仓库的删除、表的创建、表的删除、内部表、外部表、分区表、桶表、表的修改、视图。本篇文章先介绍:数据仓库的创建、数据仓库的查询、数据仓库的修改、数据仓库的删除、表的创建、表的删除,剩下的知识点在下一篇文章介绍。

一、数据仓库的创建

Hive JDBC连接

         Hive内置了HiveServer和HiveServer2服务器,两者都允许使用多种编程语言进行连接,但Hive server不能处理多个客户端的并发请求,所以产生了HiveServer2。    

        HiveServer2拥有自己的CLI,Beeline是一个基于SQLLine的JDBC客户端,由于HiveServer2是Hive开发维护的重点,所以推荐使用Beeline

建库语句

创建数据仓库的语法格式如下:

CREATE  DATABASE  [IF NOT EXISTS]  <database name> LOCATION <dir>;

IF NOT EXISTS是一个可选子句,通知用户如果该数据仓库不存在,则创建;否则报错,有错误信息提示。 所创建的数据仓库在HDFS中默认的存储路径是/user/hive/warehouse/,也可以通过关键字LOCATION指定数据仓库在HDFS中存放的位置。

二、数据库查询语句

显示数据仓库个数: hive(default)>show databases;

过滤显示查询的数据仓库: hive(default)>show databases like 'hive*';

显示数据仓库详细信息,使用命令: hive(default)> desc database extended hivedwh;

三、数据库修改语句

切换数据库 hive(default)>use hivedwh

数据仓库的修改 :使用alter  ... set .....关键字,例如:

hive(hivedwh)>alter database hivedwh set dbproperties('createtime'='20221011');

四、数据库删除语句

Drop Database是删除数据仓库中所有表并删除数据仓库的语句。删除数据仓库的语法如下: DROP DATABASE [IF EXISTS] database_name [CASCADE];

如果不知道删除的数据仓库是否存在,则使用IF EXISTS判断数据仓库是否存在。如果数据仓库不为空,其中已经有表存在,可以采用CASCADE关键字强制删除。

五、表的创建

建表语法树

建表语法树解释

CREATE TABLE,创建一个名字为table_name的表。如果该表已经存在,则抛出异常;可以用IF NOT EXISTS关键字选项来忽略异常。

使用EXTERNAL关键字可以创建一个外部表.

(col_name data_type, ...),创建表时要确定字段名及其数据类型,数据类型可以是基本数据类型,也可以是复杂数据类型。COMMENT为表和字段添加注释描述信息。

PARTITIONED BY,创建分区表。

CLUSTERED BY,创建桶表。

SORTED BY,排序。

ROW FORMAT DELIMITED,用于指定表中数据行和列的分隔符及复杂数据类型数据的分隔符。这些分隔符必须与表数据中的分隔符完全一致。

        [Fields Terminated By Char],用于指定字段分隔符。

        [Collection Items Terminated By Char],用于指定复杂数据类型Map、Struct和Array的数据分隔符。

        [Map Keys Terminated By Char],用于指定Map中的key与value的分隔符。

        [Lines Terminated By Char],用于指定行分隔符。

        默认分隔符:在vim编辑器中,连续按下Ctrl+v/Ctrl+a即可输入' \001 ' ,显示^A

STORED AS,指定表文件的存储格式,如TextFile格式、SequenceFile格式、ORC格式和Parquet格式等。如果文件数据是纯文本的,可以使用TextFile格式,这种格式是默认的表文件存储格式。如果数据需要压缩,可以使用SequenceFile格式等。

LOCATION,用于指定所创建表的数据在HDFS中的存储位置。

六、表的删除

表的删除使用关键字Drop。

当删除一个内部表时,Hive也会删除这个表中的数据,所以内部表不适合和其他工具共享数据。删除外部表并不会删除表数据,只是描述表的元数据信息会被删除。

删除表: hive(hivedwh)>drop table dept_p2;

Truncate仅删除表中数据,保留表的元数据信息。Truncate只能删除内部表中的数据,不能删除外部表中的数据。外部表在删除后,HDFS中的数据还存在,不会被删除。因此要删除外部表数据,可以把外部表转成内部表或者删除HDFS文件。Drop和Truncate可执行的操作总结在下表中。

删除内部表中的数据: hive(hivedwh)>truncate table test;

http://www.lryc.cn/news/281323.html

相关文章:

  • golang 反序列化出现json: cannot unmarshal string into Go value of type model.Phone
  • 【闯关练习】—— 1400分(构造)
  • Qt QProgressBar进度条控件
  • 【新】Unity Meta Quest MR 开发(一):Passthrough 透视配置
  • 快速排序【hoare版本】【挖坑法】【双指针法】(数据结构)
  • class_5:在c++中一个类包含另一个类的对象叫做组合
  • Linux - No space left on device
  • STC8H8K蓝牙智能巡线小车——2. 点亮左右转弯灯与危险报警灯
  • 【微信小程序独立开发 3】个人资料页面编写
  • Linux笔记:Linux中的文件系统权限
  • Android基于Matrix绘制PaintDrawable设置BitmapShader,以手指触点为中心显示原图的圆切图,Kotlin(4)
  • WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
  • 深入理解JVM虚拟机第三十九篇:JVM中新生代和老年代相关参数设置
  • 打造创新的金融数据平台,加速数字化和智能化转型丨PingCAP 官网金融行业专区上线
  • 记ubuntu2004通过NetworkManager修改网络的优先级
  • Android-常用数据结构和控件
  • react使用recoil进行全局状态管理 + axios进行网络请求
  • 基于Springboot的善筹网(众筹网-有报告)。Javaee项目,springboot项目。
  • 【Python学习】Python学习14-函数
  • C语言中对关键字和标识符的理解
  • 基于Jackson封装的JSON、Properties、XML、YAML 相互转换的通用方法
  • windows的换行符与linux风格的换行符不同的问题
  • RK3568笔记九: DRM显示摄像头
  • 简单明了,汽车级LM317系列LM317D2TR4G线性电压稳压器电源设计-参数应用方案分享
  • Flink会话集群docker-compose一键安装
  • qt.qpa.plugin: Could not find the Qt platform plugin “windows“ in ““
  • vue面试题集锦
  • 2024年学鸿蒙开发就业前景怎么样?
  • Unity网络通讯学习
  • js入口函数和jQuery入口函数的区别