[每日一练]销售分析(通过数据的0/1转换进行是否存在的查询)
#该题目来源于力扣:
1083. 销售分析 II - 力扣(LeetCode)
题目要求:
表:Product+--------------+---------+
| Column Name | Type |
+--------------+---------+
| product_id | int |
| product_name | varchar |
| unit_price | int |
+--------------+---------+
Product_id 是该表的主键(具有唯一值的列)。
该表的每一行表示每种产品的名称和价格。
表:Sales+-------------+---------+
| Column Name | Type |
+-------------+---------+
| seller_id | int |
| product_id | int |
| buyer_id | int |
| sale_date | date |
| quantity | int |
| price | int |
+------ ------+---------+
这个表可能有重复的行。
product_id 是 Product 表的外键(reference 列)。
buyer_id 永远不会是 NULL。
sale_date 永远不会是 NULL。
该表的每一行都包含一次销售的一些信息。编写一个解决方案,报告那些买了 S8 而没有买 iPhone 的 买家。注意,S8 和 iPhone 是 Product 表中显示的产品。以 任意顺序 返回结果表。结果格式如下所示。示例 1:输入:
Product table:
+------------+--------------+------------+
| product_id | product_name | unit_price |
+------------+--------------+------------+
| 1 | S8 | 1000 |
| 2 | G4 | 800 |
| 3 | iPhone | 1400 |
+------------+--------------+------------+
Sales table:
+-----------+------------+----------+------------+----------+-------+
| seller_id | product_id | buyer_id | sale_date | quantity | price |
+-----------+------------+----------+------------+----------+-------+
| 1 | 1 | 1 | 2019-01-21 | 2 | 2000 |
| 1 | 2 | 2 | 2019-02-17 | 1 | 800 |
| 2 | 1 | 3 | 2019-06-02 | 1 | 800 |
| 3 | 3 | 3 | 2019-05-13 | 2 | 2800 |
+-----------+------------+----------+------------+----------+-------+
输出:
+-------------+
| buyer_id |
+-------------+
| 1 |
+-------------+
解释:
id 为 1 的买家购买了一部 S8,但是却没有购买 iPhone,而 id 为 3 的买家却同时购买了这 2 部手机。
思路流程:
思维混乱,不如先看看将两个表合并后的数据:
# Write your MySQL query statement below
SELECT *#S.seller_id
FROM Sales S join Product P on S.product_id = P.product_id| seller_id | product_id | buyer_id | sale_date | quantity | price | product_id | product_name | unit_price |
| --------- | ---------- | -------- | ---------- | -------- | ----- | ---------- | ------------ | ---------- |
| 1 | 1 | 1 | 2019-01-21 | 2 | 2000 | 1 | S8 | 1000 |
| 1 | 2 | 2 | 2019-02-17 | 1 | 800 | 2 | G4 | 800 |
| 2 | 1 | 3 | 2019-06-02 | 1 | 800 | 1 | S8 | 1000 |
| 3 | 3 | 3 | 2019-05-13 | 2 | 2800 | 3 | iPhone | 1400 |
可以统计每一个买家购买的商品情况,把购买的商品名字进行0,1转换,建立所有关于商品名字的列,如果用户购买过,返回1,否则返回0.大概思路为:
CASE WHEN product_name = '指定的商品' THEN 1 ELSE F END 自定义列名
由于MySQL分组聚合的特性:如果在 GROUP BY
中不使用聚合函数(如 SUM
、COUNT
、AVG
等),那么 SQL 处理分组时就无法确定应该返回哪个值。标准 SQL 要求在 GROUP BY
的结果集中,除了分组列外,其他列必须用聚合函数处理。我们使用子查询实现:
# Write your MySQL query statement below
select *
from (select buyer_id,
case when product_name='S8' THEN 1 ELSE 0 end T,
case when product_name='iPhone' THEN 1 ELSE 0 END F
FROM Product P RIGHT JOIN Sales S ON P.product_id = S.product_id) A
可见成功的将商品购买数据转化为0/1形式:
| buyer_id | T | F |
————————————————————
| 1 | 1 | 0 |
| 2 | 0 | 0 |
| 3 | 1 | 0 |
| 3 | 0 | 1 |
最后进行分组聚合,按照buyer_id分组,在having条件字段里聚合T和F,条件为T(S8)的累加值>0,说明该客户至少买了一次以上的S8,F(iPhone)的累加值=0,说明该客户一次iPhone都没买过:
# Write your MySQL query statement below
select *
from (select buyer_id,
case when product_name='S8' THEN 1 ELSE 0 end T,
case when product_name='iPhone' THEN 1 ELSE 0 END F
FROM Product P RIGHT JOIN Sales S ON P.product_id = S.product_id) A
GROUP BY buyer_id
HAVING SUM(T)>0 AND SUM(F)=0
0/1数据转化可以帮助在清洗数据的时候更好的辨别某些分类数据是否存在,极大的便利了后续的分析工作