当前位置：首页 > news >正文

200.Spark（七）：SparkSQL项目实战

news 2025/7/25 21:26:32

一、启动环境

需要启动mysql，hadoop，hive，spark。并且能让spark连接上hive（上一章有讲）

#启动mysql，并登录，密码123456
sudo systemctl start mysqld
mysql -uroot -p#启动hive
cd /opt/module/
myhadoop.sh start#查看启动情况
jpsall#启动hive
cd /opt/module/hive/bin/
hiveservices.sh start#查看启动状态
/opt/module/hive/bin/hiveservices.sh status

启动beeline：

#启动thriftserver
cd /opt/module/spark-local/
sbin/start-thriftserver.sh#通过spark的beeline连接
bin/beeline -u jdbc:hive2://hadoop102:10000 -n root

创建数据库：

show databases;
create database atguigu;

二、数据准备

将三个txt文件放到datas目录下：

查看全文

http://www.lryc.cn/news/44062.html

区块链系统：挖矿原理

【博弈】【清华冬令营2018模拟】取石子

嵌入式：BSP的理解

Linux主机Tcpdump使用-centos实例

线性DP——AcWing 898. 数字三角形、AcWing 895. 最长上升子序列

怎么压缩pdf文件大小？pdf文件太大如何压缩？

阿里云Linux服务器登录名ecs-user和root选择问题

【云原生】初体验阿里云Serverless应用引擎SAE（三），挂载配置文件使应用的配置和运行的镜像解耦

Oracle用户密码过期，修改永不过期

welearn 视听说1-4

【git】将本地项目同步到远程

10-链表练习-LeetCode82删除排序链表中的重复元素II

贯穿设计模式第五话--接口隔离原则

C语言计算机二级/C语言期末考试刷题（四）

JDK8中Stream接口的常用方法

ThingsBoard源码解析-数据订阅与规则链数据处理

探究Transformer模型中不同的池化技术

Android 9.0 设置讯飞语音引擎为默认tts语音播报引擎

直流无刷电机驱动的PWM频率

机房动环监控4大价值，轻松解决学校解决问题

用于平抑可再生能源功率波动的储能电站建模及评价（Matlab代码实现）

Burpsuite详细教程

目标检测:FP(误检)和FN(漏检）统计

相关文章：