当前位置: 首页 > news >正文

Spark实训

实训目的:

介绍本实训的基本内容,描述知识目标、,以及本实训的预期效果等。
1、知识目标
(1)了解spark概念、基础知识、spark处理的全周期,了解spark技术是新时代对人才的新要求。
(2)掌握Linux、hadoop、spark、hive集群环境的搭建、HDFS分布文件系统的基础知识与应用。
(3)了解 RDD原理,掌握Scala的编程语言。
(4)了解Hive,学习Hive集群的搭建。
(5)了解spark SQL结构,搭建集群,熟练使用HiveQL语句
2、技能目标
(1)掌握spark、Scala的基础知识及在大数据技术的应用。
(2)掌握hadoop、spark、hive集群环境的搭建与HDFS分布式文件系统的灵活应用。
(3)掌握数据存储与管理,数据处理与分析等基本方法。。
(4)通过实际案例的开发,了解spark、Scala的基本开发技术。
(5)掌握Hive集群的搭建和基本使用方法。
3、素质目标
(1)认识spark在新时代对企业的重要性。
(2)具备Scala思维,熟悉Scala是新时代对人才的新要求,具备从编程角度分析未来的发展趋势,主动适应社会发展,做对社会对国家有用之人。
(3)通过综合案例实践,掌握spark、Scala以及相关框架的使用。
(4)通过项目的团队实践,掌握使用spark大数据处理的能力及解决问题的创新能力,培养学生实践开发能力及团队合作能力。

实训条件:

1、教学基本设施条件

本次实训使用思源楼1211机房,基本能够保证运行Hadoop、spark、hive集群,能够进行基本的大数据开发调试,计算机硬件基本满足以下的最低配置:内存至少8GB,硬盘可用容量至少100GB,CPU为Intel i5以上的多核(建议八核及以上)处理器。
相关软件安装包及其版本说明:
spark-3.2.1-bin-hadoop2.7.tar
Hadoop-3.1.4.tar
apache-hive-3.1.2-bin
course score student teacher word online_retail avgTemperature Volleyball_Players.csv文档
IDEA软件

Hadoop环境配置

修改配置start-dfs.sh和stop-dfs.sh文件
在这里插入图片描述

修改配置start-yarn.sh和stop-yarn.sh文件
在这里插入图片描述在这里插入图片描述

修改配置文件/etc/hosts
在这里插入图片描述

克隆虚拟机

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

http://www.lryc.cn/news/498893.html

相关文章:

  • Linux之信号集基础
  • unity3d—demo(实现给出图集名字和图片名字生成对应的图片)
  • 烟草行业通过Profinet转EthernetIP网关打通数据壁垒
  • 2020年国赛高教杯数学建模E题校园供水系统智能管理解题全过程文档及程序
  • ip地址显示本地局域网什么意思?ip地址冲突怎么解决
  • [软件工程]八.软件演化
  • 【大数据学习 | 面经】yarn的资源申请和分配的单位-Container
  • WiFi受限不再愁,电脑无网络快速修复指南
  • 【组件封装】uniapp vue3 封装一个完整的Tabs(标签页)组件教程,功能由简到杂实现讲解。
  • TDesign:Picker 选择器
  • 【AI赋能心理学论文创作策略】第十二章 AI辅助临床启示撰写指南
  • Pynsist 打包应用 和 PyWebIO 构建Web 应用
  • git 使用配置
  • 记一次Mysql的SELECT command denied to user...报错(非权限问题)
  • element-plus的el-tree的双向绑定
  • 代码随想录-算法训练营day41(动态规划04:01背包,01背包滚动数组,分割等和子集)
  • c#中context.SaveChanges()方法
  • 李飞飞首个“空间智能”模型发布:一张图,生成一个3D世界 | LeetTalk Daily
  • Node.js简单接口实现教程
  • AIGC 012-Video LDM-更进一步,SD作者将LDM扩展到视频生成任务!
  • windows文件下换行, linux上不换行 解决CR换行符替换为LF notepad++
  • npm, yarn, pnpm之间的区别
  • 静态链接和动态链接的特点
  • Mac曲线救国实现Bandizip右键一级菜单
  • 进度与预算
  • 【教程】创建NVIDIA Docker共享使用主机的GPU
  • CEEMDAN-CPO-VMD二次分解(CEEMDAN+冠豪猪优化算法CPO优化VMD)
  • 图论理论基础和存储方式的实现
  • 【实分析】【二】2.2 (c)自然数的序
  • STM32串口接收与发送(关于为什么接收不需要中断而发生需要以及HAL_UART_Transmit和HAL_UART_Transmit_IT的区别)