当前位置: 首页 > news >正文

MySQL中distinct和group by去重的区别

MySQL中distinct和group by去重的区别

请添加图片描述

在MySQL中,我们经常需要对查询结果进行去重,而DISTINCTGROUP BY是实现这一功能的两种常见方法。虽然它们在很多情况下可以互换使用,但它们之间还是存在一些差异的。接下来,我们将通过创建测试数据和执行不同的查询来探讨这两种方法的区别。

目录

  1. 创建测试数据
  2. DISTINCT使用
  3. [GROUP BY使用](#GROUP BY使用)
  4. [distinct和group by的区别](#distinct和group by的区别)
  5. 总结

创建测试数据

首先,我们创建一个测试表pageview,并插入一些数据:

SQL代码:

-- 创建测试表
DROP TABLE IF EXISTS pageview;
CREATE TABLE pageview (id BIGINT PRIMARY KEY AUTO_INCREMENT COMMENT '自增主键',aid BIGINT NOT NULL COMMENT '文章ID',uid BIGINT NOT NULL COMMENT '(访问)用户ID',createtime DATETIME DEFAULT NOW() COMMENT '创建时间'
) DEFAULT CHARSET='utf8mb4';-- 添加测试数据
INSERT INTO pageview(aid, uid) VALUES(1, 1);
INSERT INTO pageview(aid, uid) VALUES(1, 1);
INSERT INTO pageview(aid, uid) VALUES(2, 1);
INSERT INTO pageview(aid, uid) VALUES(2, 2);

DISTINCT使用

DISTINCT的基本语法如下:

SELECT DISTINCT column_name, column_name FROM table_name;

单列去重

根据aid(文章ID)去重:

SQL代码:

SELECT DISTINCT aid FROM pageview;

多列去重

根据aiduid联合去重:

SQL代码:

SELECT DISTINCT aid, uid FROM pageview;

聚合函数+去重

使用DISTINCT+聚合函数计算aid去重之后的总条数:

SQL代码:

SELECT COUNT(DISTINCT aid) FROM pageview;

GROUP BY使用

GROUP BY的基础语法如下:

SELECT column_name, column_name FROM table_name 
GROUP BY column_name;

单列去重

根据aid去重:

SQL代码:

SELECT aid FROM pageview GROUP BY aid;

DISTINCT相比,GROUP BY可以显示更多的列,而DISTINCT只能展示去重的列。

多列去重

根据aiduid联合去重:

SQL代码:

SELECT aid, uid FROM pageview GROUP BY aid, uid;

聚合函数 + GROUP BY

统计每个aid的总数量:

SQL代码:

SELECT aid, COUNT(*) FROM pageview GROUP BY aid;

distinct和group by的区别

查询结果集不同

使用DISTINCT去重时,查询结果集中只有去重列信息。而使用GROUP BY可以查询一个或多个字段。

使用业务场景不同

统计去重之后的总数量需要使用DISTINCT,而统计分组明细或在分组明细的基础上添加查询条件时,就得使用GROUP BY

性能不同

如果去重的字段有索引,那么GROUP BYDISTINCT都可以使用索引,此情况下它们的性能是相同的。而当去重的字段没有索引时,DISTINCT的性能可能会高于GROUP BY,因为在MySQL 8.0之前,GROUP BY有一个隐藏的功能会进行默认的排序,这样就会触发filesort从而导致查询性能降低。

总结

大部分场景下DISTINCT是特殊的GROUP BY,但二者也有细微的区别,比如它们在查询结果集上、使用的具体业务场景上,以及性能上都是不同的。了解这些差异可以帮助我们根据实际需求选择更合适的方法。

http://www.lryc.cn/news/514252.html

相关文章:

  • Qt判别不同平台操作系统调用相应动态库读取RFID
  • vue2+echarts实现水球+外层动效
  • C++ 基础思维导图(一)
  • 【gopher的java学习笔记】依赖管理方式对比(go mod maven)
  • CTFshow—远程命令执行
  • Qt之简易音视频播放器设计(十五)
  • ArrayList 和LinkedList的区别比较
  • Wallpaper壁纸制作学习记录13
  • Visual Studio 2022安装教程
  • std__invoke 的使用
  • 2501d,d.109
  • 1、蓝牙打印机环境搭建
  • Axure RP11安装学习
  • axios和fetch的实现原理以及区别,与XMLHttpRequest的关系,并结合react封装统一请求示例
  • 矩阵运算提速——玩转opencv::Mat
  • C++软件设计模式之模板方法模式
  • 神经网络的初始化方式都有哪些?
  • const成员函数
  • 物理知识1——电流
  • 车载通信架构 --- 智能汽车通信前沿技术
  • Flutter中添加全局防护水印的实现
  • BGP(Border Gateway Protocol)路由收集器
  • 【DAGMM】直接跑tip
  • vscode中调用deepseek实现AI辅助编程
  • AI大模型语音识别转文字
  • 可由 (5V) 单片机直接驱动的模块
  • vue使用树形结构展示文件和文件夹
  • PHP框架+gatewayworker实现在线1对1聊天--聊天界面布局+创建websocket连接(5)
  • LinuxUbuntu打开VSCode白屏解决方案
  • 在 ESP 上运行 AWTK