当前位置: 首页 > news >正文

Databricks 入门之sql(二)常用函数

1.类型转换函数

使用CAST函数转换数据类型(可以起别名)

SELECTrating,CAST(timeRecorded as timestamp)
FROMmovieRatings;

支持的数据类型有:

BIGINT、BINARY、BOOLEAN、DATE 、DECIMAL(p,s)、 DOUBLE、 FLOAT、 INT、 INTERVAL intervalQualifier、 VOID、 SMALLINT、 STRING、 TIMESTAMP、 TIMESTAMP_NTZ、 ARRAY、 MAP < keyType,valueType >、 STRUCT < [fieldName : fieldType [NOT NULL][COMMENT str][, …]] >

 2.常见统计函数

SUM、AVG、SPLIT

SELECT sum(quantity) as totalQuantity,countryName
FROM sales

3.取样函数

3.1 随机排序并取前N条

SELECT * FROM DCDataRaw
ORDER BY RAND()
LIMIT 3;

3.2 从所有数据中取样N条

SELECT * FROM outdoorProductsRaw TABLESAMPLE (5 ROWS)

3.3 按比率抽样数据

SELECT * FROM outdoorProductsRaw TABLESAMPLE (2 PERCENT) ORDER BY InvoiceDate 

4.Null值填充 COALESCE

-- Description字段为null的填充为“Misc”
SELECTCOALESCE(Description, "Misc") AS Description,SPLIT(InvoiceDate, "/")[0] month,SPLIT(InvoiceDate, "/")[1] day
FROMoutdoorProductsRaw

5. explore函数单行拆多行 

复杂的数据类型可以通过explore来拆分多行。访问深层的数据可以直接点 “.” 或[key]来查询。

-- source是key value键值对map数据
select source from DCDataRaw;

 

-- EXPLODE 与数组和映射表达式的元素一起使用。 
当与数组一起使用时,它将元素分成多行。与映射一起使用(如本例所示),它将映射的元素拆分为多行和多列,
并使用默认名称、键和值来命名新列。 
该数据结构被映射为每个键(某个设备的名称)保存一个对象(值),其中包含有关该设备的信息。SELECT EXPLODE (source)
FROM DCDataRaw;

 

通过点“.”来查询深层数据

SELECT            key,value.description,  value.ip,value.temps,value.co2_level
FROM               ExplodeSource;  

 通过[key]查询

SELECT       dc_id,to_date(date) AS date,source['sensor-igauge']
FROMDCDataRaw

 

6.日期转换, 字符串转日期类型:to_date,日期转字符串类型date_format

-- 字符串转日期格式
SELECTto_date(sDate, "MM/dd/yy") date
FROMstandardDate-- 日期转字符串格式
SELECTdate_format(date, "E") day
FROMsalesDateFormatted

6.1 查询周几 dayofweek

select dayofweek(eventDate) as dayWeek from purchaseEvents

更新中....

http://www.lryc.cn/news/152489.html

相关文章:

  • Simulink建模与仿真(3)-Simulink 简介
  • (超简单)将图片转换为ASCII字符图像
  • In-Context Retrieval-Augmented Language Models
  • 多种免费天气api
  • 深度学习推荐系统(五)DeepCrossing模型及其在Criteo数据集上的应用
  • 图神经网络教程之HAN-异构图模型
  • Jupyter lab 配置
  • 股票行情处理:不复权,前复权,后复权
  • ip地址、LINUX、与虚拟机
  • MySQL存储过程
  • element-ui 自定义loading加载样式
  • 04-Apache Directory Studio下载安装(LDAP连接工具)
  • vmware虚拟机(ubuntu)远程开发golang、python环境安装
  • Elasticsearch文档多个输入字段组成ID实现方法
  • 编译链接实战(15)rdynamic选项的用途
  • 前端:js实现提示框(自动消失)
  • powerpc架构的前世今生
  • SQL-存储过程、流程控制、游标
  • JavaScript的数组和字典的用法
  • 中断和异常
  • 【python】实现积分
  • 微信仿H5支付
  • 数据结构——栈
  • 组件化开发之如何封装组件-react
  • 大数据HBase学习圣经:一本书实现HBase学习自由
  • Leetcode110. 平衡二叉树
  • Swift的NSClassFromString转换
  • linux上vim编辑器设置
  • SpringCloudAlibaba OpenFeign整合及详解
  • Mysql--技术文档--MVCC(Multi-Version Concurrency Control | 多版本并发控制)