当前位置: 首页 > news >正文

大数据分析入门10分钟快速了解SQL

SQL是什么?

SQL全称Structured Query Language(结构化查询语言”)

为什么要用SQL?

SQL通用

常见的表格分析操作,Excel也能做,为什么不用呢?

因为处理上亿行大数据时,Excel并不够用。

而常见的大数据引擎Hive、Spark、Flink都支持SQL,SQL在大数据中是通用语言。

SQL易用

Python和Java需要自己写算法,而SQL只需要描述结果,相比写算法简单太多了。

怎么用SQL?

只需要记住你有什么数据,想要什么数据。

再找相应的语法例子,自己改一改就会用了。

简单查询(SELECT)

你有一张users表,表中有id,name,age,city_code四个字段。

如果你想要知道name为张三的人的信息,那么SQL是

select id,name,city_code 
from users where name = '张三‘

排序查询(ORDER BY)

如果你想看看最年长的10位,那么SQL是

select id,name,city_code 
from users 
order by age desc -- desc表降序,asc表示升序
limit 10

聚合查询(GROUP BY)

如果你想要知道每个城市有多少人,那么SQL是

select count(id) as cnt  
from users 
group by city_code

连接查询(JOIN)

你有一张cities表,会有city_code,city_name字段。

它如同“邮政编码”和“地区”一样将“100000”映射到“北京”。

如果users直接存city_name,当city_name变化时,需要修改users表的多行;而有了cities,只需要改cities表中的1行

如果你想要知道每个人所在城市名称,那么SQL是

select name, city_name
from users
join cities
on users.city_code=cities.city_code

总结

10分钟带你了解了SQL的大概,但SQL远不止这些。

欢迎提出你遇到的SQL问题,我会针对性的出一些教程解答大家问题的~

http://www.lryc.cn/news/342796.html

相关文章:

  • 设置多用户远程登录windows server服务器
  • 一文了解栈
  • C语言----汉诺塔问题
  • Python中驼峰命名法和下划线命名法相互转换的实战代码
  • 【hackmyvm】vivifytech靶机
  • 纯血鸿蒙APP实战开发——手写绘制及保存图片
  • 在什么情况下表单会被重复提交?如何避免?
  • JavaScript 中的 Class 类
  • python实验三 实现UDP协议、TCP协议进行服务器端与客户端的交互
  • ServiceNow 研究:通过RAG减少结构化输出中的幻觉
  • ADS基础教程10-多态性(动态模型选择)
  • 代码随想录第四十六天|单词拆分
  • RabbitMQ的介绍和使用
  • 前端get请求日期类型参数向后端传参失败
  • 【docker 】 push 镜像提示:denied: requested access to the resource is denied
  • 浏览器各类好用插件使用及常见问题(技巧)总结
  • Python批量计算多张遥感影像的NDVI
  • 6.k8s中的secrets资源
  • git 更换远程仓库地址三种方法总结
  • 快速找出存(不存在)在某个(或多个)文件的文件夹
  • Linux USB转串口设备路径的查找方法
  • 【初阶数据结构】单链表之环形链表
  • 【积分,微分,导数,偏导数公式推导】
  • java:递归实现的案例
  • Arxml文件解析03- 自动驾驶Radar服务radar_svc.arxml
  • Elasticsearch安装步骤
  • Windows系统和unbtun系统连接usb 3.0海康可见MVS和红外艾睿相机
  • 深入Django:用户认证与权限控制实战指南
  • Kubernetes - Dashboard 配置用户名密码方式登录
  • AIGC能给人类社会带来哪些变革?