当前位置: 首页 > news >正文

【Hadoop-Distcp】通过Distcp的方式进行两个HDFS集群间的数据迁移

【Hadoop-Distcp】通过Distcp的方式进行两个HDFS集群间的数据迁移

  • 1)Distcp 工具简介及参数说明
  • 2)Shell 脚本

1)Distcp 工具简介及参数说明

【Hadoop-Distcp】工具简介及参数说明

2)Shell 脚本

  • 应用场景:

    两个实时集群交互数据,A 集群B 集群补充数据。

  • 主要说明:

    1、将表名统一放到服务器文本 hotDataTable 中,按照需要将需要补充数据的表放入文本即可。

    2、-i 参数:跳过异常,避免文件迁移过程中出现文件不存在等异常情况出现,异常会中断迁移任务。

    3、-skipcrccheck 参数:跳过 crc 算法校验,会加快数据传输速度。

    4、-update 与 -delete 参数:按照文件进行校验,B 集群 有的会保存,B 集群 没有的会按照 A 集群 进行迁移,B 集群 多出的会进行删除。(通常update与delete一起使用)

  • 其余说明请参考:

    【Hadoop-Distcp】工具简介及参数说明

kinit -kt /opt/conf/test.keytab test@PRD.TEST.COM
for tablename in `cat /opt/corns/hotDataTable`
do
hadoop distcp -D ipc.client.fallback-to-simple-auth-allowed=true \
-D mapred.task.timeout=60000000 \
-D mapreduce.job.name=${tablename}-${sample_date} \
-Dmapred.job.queue.name=queuename \
-i \
-skipcrccheck \
-update \
-delete \
-direct \
-bandwidth=60 \
-m=50 \
-numListstatusThreads=40 \
webhdfs://10.1.1.1:4008/user/test/hive/dw_test.db/${tablename}/sample_date=${sample_date}/ \
hdfs://nameserver/warehouse/tablespace/external/hive/test.db/${tablename}/sample_date=${sample_date}
done
http://www.lryc.cn/news/259532.html

相关文章:

  • 【Linux】使用Bash和GNU Parallel并行解压缩文件
  • T天池SQL训练营(五)-窗口函数等
  • 道可云元宇宙每日资讯|上海市区块链关键技术攻关专项项目立项清单公布
  • 大语言模型有什么意义?亚马逊训练自己的大语言模型有什么用?
  • RabbitMQ-学习笔记(初识 RabbitMQ)
  • SQL Update语句
  • C语言-WIN32API介绍
  • TFIDF、BM25、编辑距离、倒排索引
  • MySQL之DML语句
  • kubernetes集群常用指令
  • PyQt6 QTreeView树视图
  • 链表|148. 排序链表
  • 如何解决5G基站高能耗问题?
  • PyTorch实现逻辑回归
  • 什么是FPGA原型验证?
  • 基于VUE3+Layui从头搭建通用后台管理系统(前端篇)十四:系统设置模块相关功能实现
  • 使用Visual Studio(VS)创建空项目的Win32桌面应用程序【main函数入口变WinMain】
  • 基于自动化脚本批量上传依赖到nexus内网私服
  • Linux中ps命令使用指南
  • PHP开发语言中,网页端常用的标签
  • Java 入门第四篇 集合
  • VBA技术资料MF93:将多个Excel表插入PowerPoint不同位置
  • STM32 MCU的易坑点收集
  • Vue3项目filter.js组件封装
  • Linux: pwd命令查看当前工作目录
  • 【深度学习】PHP操作mysql数据库总结
  • 【送书活动】探究AIGC、AGI、GPT和人工智能大模型
  • Apple Find My「查找」认证芯片找哪家,认准伦茨科技ST17H6x芯片
  • java.lang.IllegalArgumentException: Could not resolve placeholder XXX‘ in value
  • 自动机器学习是什么?概念及应用