当前位置: 首页 > news >正文

Apache Hive(部署+SQL+FineBI构建展示)

在这里插入图片描述

在这里插入图片描述

Hive架构

在这里插入图片描述
在这里插入图片描述

Hive部署

在这里插入图片描述
在这里插入图片描述

VMware虚拟机部署

一、在node1节点安装mysql数据库
在这里插入图片描述

二、配置Hadoop
在这里插入图片描述

三、下载 解压Hive
在这里插入图片描述

四、提供mysql Driver驱动
在这里插入图片描述

五、配置Hive
在这里插入图片描述
在这里插入图片描述

六、初始化元数据库
在这里插入图片描述

七、启动Hive(Hadoop用户)

chown -R hadoop:hadoop apache-hive-3.1.3-bin hive
在这里插入图片描述

阿里云部署
在这里插入图片描述

一、创建云数据库库
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、配置Hive
在这里插入图片描述
数据库连接地址粘贴到配置文件中
在这里插入图片描述
通过yum install -y mysql 安装mysql客户端,用于mysql命令的输入

UCloud云部署
在这里插入图片描述

一、创建UDB数据库
在这里插入图片描述

二、创建一个Hive数据库(需要通过yum install -y mysql提前安装命令)
在这里插入图片描述

三、初始化
在这里插入图片描述

============================================================

Hive操作

通过ps -ef | grep 40991更详细查看
或者通过jps查看
在这里插入图片描述

在这里插入图片描述

通过浏览器可以查看
在这里插入图片描述

Hive客户端

在这里插入图片描述

启动Hive客户端两种方式:
①、bin/hive即Hive的Shell客户端,直接写SQL
②、bin/hive --service hiveserver2 HiveServer2属于Hive内置的一个ThriftServer服务,提供Thrift端口供其他客户端链接:

可以链接ThriftServer的客户端有:

  • Hive内置的beeline客户端工具(命令行工具)
  • 第三方图形化SQL工具DataGrip 或DBeaver或者Navicat

在这里插入图片描述

HiveServer2 & Beeline(内置客户端)

①、启动beeline
在这里插入图片描述
②、连接hive2
在这里插入图片描述

DataGrip & DBeaver(第三方客户端)

①、DataGrip使用
在这里插入图片描述
②、进行连接
在这里插入图片描述
在这里插入图片描述

③、写SQL语句
在这里插入图片描述
在这里插入图片描述


①、DBeaver使用
在这里插入图片描述
②、构建驱动
在这里插入图片描述

删除原来的驱动
在这里插入图片描述
添加自己本地下载好的文件
在这里插入图片描述
③、写好SQL,回车可以运行
在这里插入图片描述

数据库操作

在这里插入图片描述
在这里插入图片描述

表分类:

内部表
在这里插入图片描述
在这里插入图片描述

create table myhive.stu(id int,name string); # 在myhive数据库中创建stu表# 指定分隔创建表 避免在下面查看表内容出现id和name不可见字符导致的紧凑
create table if not exists stu2(id int,name string) row format delimited fields terminated by '\t';insert into myhive.stu values(1,'jordan'),(2,"kobe");

在这里插入图片描述

外部表
在这里插入图片描述

一、将数据上传到外部表所在的目录(先有表,再有数据)
在这里插入图片描述
在这里插入图片描述

二、先存在数据,后创建表
在这里插入图片描述

两者对比:
在这里插入图片描述

内外部表转换:

①、先查看表类型
在这里插入图片描述

②、转换
在这里插入图片描述

数据的导入:

①、使用LOAD语法,从外部将数据加载到Hive内
在这里插入图片描述

CREATE TABLE myhive.test_load(dt string comment '时间(时分秒)',user_id string comment '用户ID',word string comment '搜索词',url string comment '用户访问地址'
) comment '搜索引擎日志表' ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

在这里插入图片描述

# 本地linux系统上传
load data local inpath '/home/hadoop/search_log.txt' into table myhive.test_load;# 本质上是文件移动
load data inpath '/tmp/search_log.txt' overwrite into table myhive.test_load

【基于HDFS进行load加载数据,元数据文件会消失(本质是被移动到表所在的目录中)】
在这里插入图片描述

②、从其他表加载数据
在这里插入图片描述

数据的导出:

①、将hive表中的数据导出到其他任意目录,例如linux本地磁盘,hdfs,mysql等
在这里插入图片描述

②、通过hive shell方式导出
在这里插入图片描述

分区表
在这里插入图片描述

在这里插入图片描述

构建分区表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

分桶表
在这里插入图片描述

分桶表创建
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

修改表操作
在这里插入图片描述

复杂类型

在这里插入图片描述

array数组
在这里插入图片描述
在这里插入图片描述

map映射
在这里插入图片描述
在这里插入图片描述

struct结构
在这里插入图片描述

在这里插入图片描述

常用的基本查询
在这里插入图片描述
在这里插入图片描述

正则表达式
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

UNION联合
在这里插入图片描述
在这里插入图片描述

随机采样
在这里插入图片描述

在这里插入图片描述

虚拟列
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

函数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

案例:

一、需求:
在这里插入图片描述

数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、ETL数据清洗:
在这里插入图片描述
在这里插入图片描述

三、指标

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、可视化
在这里插入图片描述
①、下载FineBI
在这里插入图片描述

②、将Hive驱动包放到FineBI安装目录下,以及安装隔离插件
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

③、建立数据库连接
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

④、构建数据集(选择数据库表)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
添加组件和仪表盘
在这里插入图片描述

http://www.lryc.cn/news/254635.html

相关文章:

  • python入门级简易教程
  • 模拟一个集合 里面是设备号和每日的日期
  • antdesign前端一直加载不出来
  • 排序算法介绍(一)插入排序
  • 2023新优化应用:RIME-CNN-LSTM-Attention超前24步多变量回归预测算法
  • RNN:文本生成
  • Rust UI开发(五):iced中如何进行页面布局(pick_list的使用)?(串口调试助手)
  • Linux学习笔记2
  • 数据结构算法-插入排序算法
  • 安装Kuboard管理K8S集群
  • 网络安全行业大模型调研总结
  • Linux AMH服务器管理面板本地安装与远程访问
  • Sharding-Jdbc(3):Sharding-Jdbc分表
  • zookeeper集群 +kafka集群
  • 2022年全国大学生数据分析大赛医药电商销售数据分析求解全过程论文及程序
  • Python版本与opencv版本的对应关系
  • 【开源视频联动物联网平台】LiteFlow
  • 家用智能门锁——智能指纹锁方案
  • Qt6 QRibbon 一键美化Qt界面
  • JAVA IO:NIO
  • Python 在控制台打印带颜色的信息
  • SQL Server 数据库,创建触发器避免数据被更改
  • C语言实现植物大战僵尸(完整版)
  • 基于YOLOv8深度学习的火焰烟雾检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战
  • 【C++】手撕string思路梳理
  • 【数据结构和算法】确定两个字符串是否接近
  • [足式机器人]Part2 Dr. CAN学习笔记-Ch0-1矩阵的导数运算
  • 如何让软文更具画面感,媒介盒子分享
  • Hadoop学习笔记(HDP)-Part.19 安装Kafka
  • Arrays类练习 - Java