当前位置: 首页 > news >正文

数据导入导出

1.数据加载 - LOAD 语法

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename;

操作: 建表

CREATE TABLE myhive.test_load(
dt string comment ' 时间(时分秒) ',
user_id string comment ' 用户 ID',
word string comment ' 搜索词 ',
url string comment ' 用户访问网址 '
) comment ' 搜索引擎日志表 ' ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';

注意,基于 HDFS 进行 load 加载数据,源数据文件会消失(本质是被移动到表所在的目录中)

命令:load data local inpath '/home/wtk/search_log.txt' into table test_load;

select查看:

方式2:

数据加载 - INSERT SELECT 语法

INSERT [OVERWRITE | INTO] TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1 FROM from_statement

操作:insert into myhive.test_load1 (select * from test_load);

select查看:一样的数据在新表

3.hive 表数据导出 - insert overwrite 方式

语法: insert overwrite [local] directory ‘path’ select_statement1 FROM from_statement
   导出到本地Linux:
insert overwrite local directory '/home/wtk' row format delimited fields terminated by '\t' select * from test_load;

查看:

方式2:hive 表数据导出 - hive shell

基本语法:( hive -f/-e 执行语句或者脚本 > file )
bin/hive -e "select * from myhive.test_load;" > /home/wtk/1.txt

注意事项:使用 LOAD 语句:• 数据来源本地,本地数据文件会保留,本质是本地文件上传到表里
• HDFS 据来自 HDFS ,加载后文件不存在,本质是在 HDFS 上进行文件移动

http://www.lryc.cn/news/467873.html

相关文章:

  • git的安装以及入门使用
  • 【acwing】算法基础课-搜索与图论
  • 502 错误码通常出现在什么场景?
  • 面试经典算法题69-两数之和
  • 在 Spring 框架中,循环依赖是指两个或多个 Bean 之间相互依赖
  • 一文带你入门Flink CDC
  • 修复jenkins SSH 免密登录发布服务器
  • 049_python基于Python的热门微博数据可视化分析
  • 中国信通院联合中国电促会开展电力行业企业开源典型实践案例征集
  • LOAM 20.04 ros1安装
  • Pyqt5设计打开电脑摄像头+可选择哪个摄像头(如有多个)
  • mysqldump 批量导出数据库表
  • 前端工程师面试题整理
  • Linux 权限的理解
  • 『完整代码』按钮开关UI界面
  • 梦结束的地方 -- 爬楼梯
  • 身份证识别JAVA+OPENCV+OCR
  • 独立开发者如何利用AI实现高收入
  • Go第三方框架--gorm框架(一)
  • ONLYOFFICE文档8.2:开启无缝PDF协作
  • 内网python smtplib用ssh隧道通过跳板机发邮件
  • 基于C#开发游戏辅助工具的Windows底层相关方法详解
  • SSRF+Redis进行内网渗透
  • 栈与队列-Java【力扣】【算法学习day.7】
  • 最新版本!IntelliJ IDEA 2024.2.4 (Ultimate Edition) 的新特性
  • 从头学PHP之运算符
  • 使用 Git LFS(大文件存储)
  • js 将一维数组转换成树形结构的方法
  • HarmonyOS NEXT开发实战:实现高效下拉刷新与上拉加载组件(二)刷新核心逻辑与空页面集成
  • Crawler4j在多线程网页抓取中的应用