当前位置: 首页 > news >正文

HDFS基本操作命令

这里写目录标题

  • HDFS Shell CLI客户端
    • 说明
    • 常用命令
      • hadoop fs -mkdir [-p] <path>
      • hadoop fs -ls [-h] [-R] [<path>...]
      • 上传文件到指定目录下
        • 方法一:hadoop fs -put [-f] [-p] <localsrc>.....<dst>
        • 方法二:hadoop fs -moveFromLocal <localsrc>....<dst>
      • 查看HDFS文件内容
        • 方法一:hadoop fs -cat <src> ...
        • 方法二:hadoop fs -head <file>
        • 方法三:hadoop fs -tail [-f] <file>
      • 下载文件
        • 方法一:hadoop fs -get [-f] [-p] <src>...<localdst>
        • 方法二:合并下载hdfs文件
      • 拷贝文件
      • 追加数据到hdfs文件中
      • 查看hdfs磁盘空间
      • 查看hdfs文件使用的空间
      • hdfs数据移动操作
      • 修改hdfs文件副本个数

HDFS Shell CLI客户端

说明

  • hdfs shell cli支持操作多种文件系统,包括本地文件系统(file:///),分布式文件系统(hdfs:nn:8020)等
  • 操作的是什么文件系统取决于URL种的前缀协议
  • 如果没有指定前缀,则将会读取环境变量汇总的fs.defaultFS属性,以该属性作为默认文件系统
    • hdfs dfs -ls file:/// #操作本地文件系统
    • hdfs dfs -ls hdfs://node1:8020/ #草足hdfs分布式文件系统
    • hdfs dfs -ls / #直接根目录,没有指定协议,将夹在读取fs.default FS
      在这里插入图片描述

常用命令

hadoop fs -mkdir [-p]

path 为待创建的目录
-p选项的行为与unix mkdir -p非常相似,他会沿着路径创建父目录
在这里插入图片描述

hadoop fs -ls [-h] [-R] [ …]

path 指定目录路径
-h显示文件size
-R 递归查看指定目录及其子目录
在这里插入图片描述

上传文件到指定目录下

方法一:hadoop fs -put [-f] [-p] …

-f 覆盖目标文件(已经存在)
-p保留访问和修改时间,所有圈和权限
localsrc 本地文件系统(客户端所在机器)
dst 目标文件系统(HDFS)
在这里插入图片描述

方法二:hadoop fs -moveFromLocal …

和-put功能一样,只不过上传结束,源数据会被删除

hadoop fs -moveFromLocal caixukun.csv /tmp/

查看HDFS文件内容

方法一:hadoop fs -cat …

读取指定文件全部内容,显示在标准输出控制台
注意:对于大文件内容读取,慎重

方法二:hadoop fs -head

查看文件前1kb的内容

hadoop fs -head /source/weibo/star/comment_log/29304839_node1.tcast.cn/caixukun.csv

方法三:hadoop fs -tail [-f]

查看文件最后1kb的内容
-f选择可以动态显示文件中追加的内容

hadoop fs -tail -f  /source/weibo/star/comment_log/29304839_node1.tcast.cn/caixukun.csv

下载文件

方法一:hadoop fs -get [-f] [-p] …

下载文件到本地文件系统指定目录,localdst必须是目录
-f覆盖目标文件(已存在下)
-p保留访问和修改时间,所有权和权限
在这里插入图片描述

方法二:合并下载hdfs文件

命令:hadoop fs -getmerge [-n1] [-skip-empty-file]
下载多个文件合并到本地文件系统的一个文本中
-n1选项表示在每个文件末尾添加换行符

拷贝文件

hadoop fs -cp [-f] …
-f覆盖目标文件<已存在下>

在这里插入图片描述

追加数据到hdfs文件中

hadooToFile …
dst如果文件不存在,将创建文件。
如果为空,则输入为从标准输入中读取
在这里插入图片描述

查看hdfs磁盘空间

hdaoop fs -df [-h] [ …]
显示文件系统的容量,可用空间和已用空间

查看hdfs文件使用的空间

hadoop fs -du [-s] [-h]
-s:表示显示指定路径文件长度的汇总摘要,而不是单个文件的摘要

-h:选项将以“人类可读”的方式格式化文件大小

hadoop fs -du -s -h -v /source/weibo/

hdfs数据移动操作

hadoop fs -mv …
移动文件到指定文件夹下
可以使用该命令移动数据,重命名文件的名称

修改hdfs文件副本个数

hadoop fs -setrep [R] [-w]
修改指定文件的副本数
-R表示递归 修改文件夹及其所有
-w客户端是否等待副本修改完毕

http://www.lryc.cn/news/95558.html

相关文章:

  • git 实操
  • Visual Studio Code Python 扩展中的包管理
  • spring学习笔记九
  • java list stream 使用
  • 两个Ubuntu电脑用SSH远程连接
  • 讲解 @ServletComponentScan注解
  • 20款奔驰S350商务型加装原厂前排座椅通风系统,夏天必备的功能
  • Rust vs Go:常用语法对比(十一)
  • Spring MVC拦截器和跨域请求
  • C++初阶--C++入门
  • Matlab实现PID控制仿真(附上30个完整仿真源码+数据)
  • 微信小程序:文件下载
  • QString和QByteArray的区别
  • Vue3 Vite electron 开发桌面程序
  • 【Nodejs】Express模板使用
  • 【iOS】App仿写--管理系统
  • JS实现队列的数据结构
  • title: 用 LangChain 构建基于资料库的问答机器人(四):通过代理使用外部工具
  • 使用 CSS 自定义属性
  • Unity 性能优化一:性能标准、常用工具
  • 【http长连接+池化】
  • opencv-20 深入理解HSV 色彩空间(通过指定,标记颜色等来拓展ROI区域)
  • python调用arcgis功能一例
  • Spring MVC 是什么?
  • Rust操作MySQL
  • JAVA面试总结-Redis篇章(二)——缓存击穿
  • Spring相关知识点
  • Nginx专题--反向代理(未完成)
  • 什么是搜索引擎?2023 年搜索引擎如何运作?
  • Spring系列一:spring的安装与使用