当前位置: 首页 > news >正文

hive库表占用空间大小的命令

1、查每个hive表占用的空间大小

hdfs dfs -du -h /user/hive/warehouse

2、按占用空间大小降序排列

hdfs dfs -du  /user/hive/warehouse/ipms.db | sort -nr

3、查某一个分区占用空间大小(单位G)

hadoop fs -ls /user/hive/warehouse/ipms.db/dw_ft_se_nt_u_gen_h/fp_rat=6/stat_month=201709/stat_date=20170903/stat_hour=2017090323|awk -F ' ' '{print $5}'|awk '{a+=$1}END {print a/(1024*1024*1024)}'

4、查某一个表总占用空间大小(单位G)

hadoop fs -du /user/hive/warehouse/ipms.db/dw_ft_se_nt_u_gen_h|awk ' { SUM += $1 } END { print SUM/(1024*1024*1024) }'

5、统计hdfs某个表文件的数据量

hadoop fs -cat /user/hive/warehouse/ipms.db/dw_ft_se_nt_us_cl_h/fp_rat=9/stat_month=202401/stat_date=20240109/stat_hour=2024010906/* | wc -l

6、统计表的大小

hdfs dfs -du -s -h /user/hive/warehouse/ipms.db/dw_msisdn_cell_record_d

http://www.lryc.cn/news/318003.html

相关文章:

  • 关于go中的select
  • 【Node.js从基础到高级运用】十一、构建RESTful API
  • Python和MATLAB数字信号波形和模型模拟
  • 华为OD技术C卷“测试用例执行计划”Java解答
  • solana 入门 1
  • JavaEE之多线程(创建线程的五种写法)详解
  • ChatGPT国内能用吗?中国用户怎么才能使用ChatGPT?
  • 集群保持集群负载均衡和hash一致性
  • 吴恩达深度学习笔记:神经网络的编程基础2.9-2.14
  • 在C++项目中使用python脚本(四种)常见报错解决
  • 微前端框架 qiankun 配置使用【基于 vue/react脚手架创建项目 】
  • nodejs切换淘宝源
  • 怎么避免电脑数据被拷贝?电脑如何禁用USB功能?
  • 给电脑加硬件的办法 先找电脑支持的接口,再买相同接口的
  • uniapp微信小程序_自定义交费逻辑编写
  • 论文阅读——RingMo
  • Hadoop,Hive 数据预处理CR
  • 小程序开发——获取设备信息 API(三)
  • Vue2 + node.js项目
  • 如何使用IDE端通义灵码
  • 微服务分布式springcloud的体育场地预约系统演kdm1z
  • IDEA开启Run Dashboard
  • 小程序学习3 goods-card
  • 【投稿优惠-EI稳定检索】2024年图像处理与机械系统工程国际学术会议 (ICIPMSE 2024)
  • Linux系列
  • SQL笔记 -- 黑马程序员
  • C# MES通信从入门到精通(1)——串口传输文件
  • 论文阅读-federated unlearning via class-discriminative pruning
  • 研发效能DevOps: OpenEuler 部署 drone 持续集成平台
  • C#,图论与图算法,图着色问题(Graph Coloring)的威尔士-鲍威尔(Welch Powell Algorithm)算法与源代码