当前位置: 首页 > news >正文

mysql 过滤多列重复的值(保留其中一条),对单列或者多列重复的值去重

建立测试数据表

CREATE TABLE `test` (`id` int(11) NOT NULL AUTO_INCREMENT,`account` varchar(255) DEFAULT NULL,`password` varchar(255) DEFAULT NULL,`deviceId` varchar(255) DEFAULT NULL,PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8mb4;INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (10, 'A', '123456', 'A111');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (20, 'B', '1234562', 'A222');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (30, 'C', '123456', 'A333');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (40, 'D', '1234563', 'A444');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (50, 'E', '1234561', 'A111');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (60, 'C', '1234561', 'A333');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (70, 'C', '1234564', 'A333');
INSERT INTO `test`.`test` (`id`, `account`, `password`, `deviceId`) VALUES (80, 'D', '1234565', 'A444');

根据单列去重

-- 找到哪些是重复的行
-- 赛选需要留下的行
-- 从重复的行去除留下的行,得到需要排除的行
SELECT* 
FROMtest 
WHEREid NOT IN (SELECTid FROMtest WHEREaccount IN ( SELECT account FROM test GROUP BY account HAVING count( account ) > 1 ) AND id NOT IN ( SELECT max( id ) FROM test GROUP BY account HAVING count( account ) > 1 ) )

根据多列去重

-- group by 之后使用的聚合函数都是统计组内的信息,
-- only_full_groupby模式要明确分组之后select的值应该取哪一个,如果取的字段无法适用于任何聚合函数的话,可以用any_value 但是any_value到底是取得哪一个呢,常用的场景是先排序再分组取第一个
-- 需要子查询或者join,根据查询的重复字段去原始记录表匹配
SELECT* 
FROMtest 
WHEREid NOT IN (SELECTid FROMtest join  ( SELECT account,deviceId FROM test GROUP BY account, deviceId HAVING count( account ) > 1 and count(deviceId) > 1 ) as ref on ref.account = test.account and ref.deviceId = test.deviceIdAND id NOT IN ( SELECT min(id) FROM test GROUP BY account, deviceId HAVING count( account ) > 1 and count(deviceId) > 1 ) )

在查找所有的重复列的时候,可以用子查询去匹配也可以用join。看哪个用的熟练了。

简介版

SELECT* 
FROMtest 
WHEREid  IN (SELECT min(id) AS idFROM testGROUP BY account, deviceId)

参考

https://blog.csdn.net/qq_35387940/article/details/108074927

http://www.lryc.cn/news/196018.html

相关文章:

  • 面向红队的自动化引擎工具
  • Python库学习(十):Matplotlib绘画库
  • coverity工具 代码审计
  • 女鹅冬天的第一件羽绒服,当然要时尚经典的
  • 智慧渔业方案:AI渔政视频智能监管平台助力水域禁渔执法
  • LXC、Docker、 Kubernetes 容器以及Hypervisor的区别
  • 电子杂志制作不求人:简单易用的工具推荐
  • Excel冻结窗格
  • Flink自定义sink并支持insert overwrite 功能
  • CSS Vue/RN 背景使用opacity,文字在背景上显示
  • vue3自定义指令批量注册
  • 山西电力市场日前价格预测【2023-10-18】
  • 2-k8s-控制器介绍
  • 【数据结构】二叉树--OJ练习题
  • 时间复杂度为 O(n^2) 的排序算法
  • ES6 Map数据结构
  • 网页数据采集HTTP Get,Post登录提交数据--VBS之Microsoft.XMLHTTP对象
  • 强化科技创新“辐射力”,中国移动的数智化大棋局
  • 喜报 | 擎创科技实力亮相2023科创会并荣获科技创新奖
  • vue3学习(九)--- keep-alive缓存组件
  • 用servlet实现一个简单的猜数字游戏。
  • 前端取消请求
  • 关于6轴球腕机械臂的肩部奇异描述纠正
  • Python —— hou.Node class
  • MATLAB——RBF、GRNN和PNN神经网络案例参考程序
  • E138: Can‘t write viminfo file
  • Compose Canvas基础(2) 图形转换
  • 【计算机网络笔记】分组交换中的报文交付时间计算例题
  • JVS-rules规则引擎,解决大数据风控的自动化决策利器
  • dvaJs在react 项目中的简单使用