当前位置: 首页 > news >正文

7.3实验部分

一、HDFS基础操作
以root用户登录,创建如下HDFS目录:
/dw/yourname/input
hadoop fs -mkdir -p /dw/zhanggengchen/input

/dw/yourname/output
hadoop fs -mkdir -p /dw/zhanggengchen/output

输出结果:
[root@master hadoop-mapreduce]# hadoop fs -ls /dw/zhanggengchen
Found 2 items
drwxr-xr-x   - root supergroup          0 2025-07-03 18:14 /dw/zhanggengchen/input
drwxr-xr-x   - root supergroup          0 2025-07-03 18:15 /dw/zhanggengchen/output


上传本地文件 /root/dataExercise/people.txt 到 /dw/yourname/input 目录下。
hadoop fs -put /root/dataExercise/people.txt /dw/zhanggengchen/input/

列出 /dw/yourname/input 目录内容,并显示 people.txt 文件前5行内容。
hadoop fs -cat /dw/zhanggengchen/input/people.txt | head -n 5

输出结果:
[root@master hadoop-mapreduce]# hadoop fs -cat /dw/zhanggengchen/input/people.txt | head -n 5
Michael, 29
Andy, 30
Justin, 19

二、Sqoop数据导入
Mysql数据库连接信息:

主机:localhost
端口:3306
用户名:root
密码:bimao123
需求

使用Sqoop将MySQL数据库的bigdatafamily中的customers表导入到HDFS目录 /dw/yourname/customers,要求:
数据格式为文本,字段分隔符为\t
vim TODO3.sh

sqoop import \
--connect jdbc:mysql://localhost:3306/bigdatafamily \
--username root \
--password bimao123 \
--table customers \
--target-dir /dw/zhanggengchen/customers \
--fields-terminated-by '\t' \
--as-textfile

列出 /dw/yourname/customers 目录内容,并显示部分导入数据内容。
[root@master hadoop-mapreduce]# hadoop fs -ls /dw/zhanggengchen/customers

输出结果:
Found 5 items
-rw-r--r--   1 root supergroup          0 2025-07-03 18:32 /dw/zhanggengchen/customers/_SUCCESS
-rw-r--r--   1 root supergroup    3144522 2025-07-03 18:32 /dw/zhanggengchen/customers/part-m-00000
-rw-r--r--   1 root supergroup    3143941 2025-07-03 18:32 /dw/zhanggengchen/customers/part-m-00001
-rw-r--r--   1 root supergroup    3144303 2025-07-03 18:32 /dw/zhanggengchen/customers/part-m-00002
-rw-r--r--   1 root supergroup    3144580 2025-07-03 18:32 /dw/zhanggengchen/customers/part-m-00003

[root@master hadoop-mapreduce]# hadoop fs -cat /dw/zhanggengchen/customers/part-m-00000 | head -n 3

输出结果:
1000000    Quentin    Shepard    32092 West 10th Street    Prairie City    SD    57649
1000001    Brandon    Louis    1311 North 2nd Street    Clearfield        IA    50840
1000002    Marilyn    Ham    25831 North 25th Street    Concord    CA    94522

http://www.lryc.cn/news/579743.html

相关文章:

  • 工程化实践——标准化Eslint、PrettierTS
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | DragNDrop(拖拽占用组件)
  • Selenium 自动化测试中跳过机器人验证的完整指南:能用
  • 供应链管理:采购与供应链管理中的核心分析工具
  • js代码中的作用域
  • Linux: perf report数据对比,python
  • ArcGISPro应用指南:ArcGISPro制图全流程详解
  • Java综合练习04
  • 优化Facebook广告投放的五大关键策略
  • 机器学习安装使用教程
  • SpringSecurity01
  • win11设置任务栏为顶部
  • 「Java流程控制」循环综合应用
  • oracle锁表,oracle解锁表,oracle用户连接数
  • [自然语言处理]计算语言的熵
  • [自然语言处理]汉语文本分词
  • 百战商店项目学习心得
  • Qt Creator自定义控件开发流程
  • visio画大括号和失败的大模型画图尝试
  • Doris 数据导入性能优化全攻略:深度诊断与全面提速指南
  • 冒泡排序及其优化方式
  • LED闪烁 + PWM呼吸灯
  • 【React Native原生项目不能运行npx react-native run-android项目】
  • Redis 持久化详解、使用及注意事项
  • 《C++MLpack库 聚类算法》实战指南
  • day15——Java常用API(二):常见算法、正则表达式与异常处理详解
  • 玄机——某医院系统被脱库
  • 板凳-------Mysql cookbook学习 (十一--------3)
  • 项目中数据库表设计规范与实践(含案例)
  • OS15.【Linux】gdb调试器的简单使用