当前位置: 首页 > news >正文

大数据课程K21——Spark的SparkSQL基础语法

文章作者邮箱:yugongshiye@sina.cn              地址:广东惠州

 ▲ 本章节目的

⚪ 掌握Spark的SparkSQL通过方法来使用;

⚪ 掌握Spark的SparkSQL通过sql语句来调用;

一、SparkSQL基础语法——通过方法来使用

1. 查询

df.select("id","name").show();

2. 带条件的查询

df.select($"id",$"name").where($"name" === "bbb").show()

3. 排序查询

orderBy/sort($"列名")  升序排列

orderBy/sort($"列名".desc)  降序排列

orderBy/sort($"列1" , $"列2".desc) 按两列排序

df.select($"id",$"name").orderBy($"name".desc).show

df.select($"id",$"name").sort($"name".desc).show

tabx.select($"id",$"name").sort($"id",$"name".desc).show

4. 分组查询

groupBy("列名", ...).max(列名) 求最大值

groupBy("列名", ...).min(列名) 求最小值

groupBy("列名", ...).avg(列名) 求平均值

groupBy("列名", ...).sum(列名) 求和

groupBy("列名", ...).count() 求个数

groupBy("列名", ...).agg 可以将多个方法进行聚合

scala>val rdd = sc.makeRDD(List((1,"a","bj",100),(2,"b","sh",80),(3,"c","gz",50),(4,"d","bj",45)));

scala>val df = rdd.toDF("id","name","addr","score");

scala>df.groupBy("addr").count().show()

http://www.lryc.cn/news/162300.html

相关文章:

  • 【实践篇】Redis最强Java客户端(三)之Redisson 7种分布式锁使用指南
  • 卫星通话过后,卫星导航产业被彻底激活
  • 【算法训练-链表 七】【排序】:链表排序、链表的奇偶重排、重排链表
  • LGB的两种写法
  • 【Unity的HDRP下ShaderGraph实现权重缩放全息投影_(内附源码)】
  • 透视俄乌网络战之二:Conti勒索软件集团(上)
  • 【华为OD机试python】拔河比赛【2023 B卷|100分】
  • 05 CNN 猴子类别检测
  • 【C#】关于Array.Copy 和 GC
  • Vue前端框架08 Vue框架简介、VueAPI风格、模板语法、事件处理、数组变化侦测
  • WebStorm使用PlantUML
  • Python做批处理,给安卓设备安装应用和传输图片
  • 如何获取springboot中所有的bean
  • 大数据技术之Hadoop:HDFS存储原理篇(五)
  • 用C语言实现牛顿摆控制台动画
  • 如何自己开发一个前端监控SDK
  • node.js笔记
  • mysql 增量备份与恢复使用详解
  • 9月5日上课内容 第一章 NoSQL之Redis配置与优化
  • QT 第四天
  • nrf52832 GPIO输入输出设置
  • MyBatis 动态 SQL 实践教程
  • CSS 斜条纹进度条
  • JavaScript(1)每天10个小知识点
  • scanf和scanf_s函数详解
  • 基于SSM的在线购物系统
  • 认识JVM的内存模型
  • Java8实战-总结19
  • 论文浅尝 | 训练语言模型遵循人类反馈的指令
  • 【云计算网络安全】解析DDoS攻击:工作原理、识别和防御策略 | 文末送书