当前位置: 首页 > news >正文

对List集合、数组去重

前言:

还记得在2021我发布的第一篇博客就是关于数组的去重,从那一刻开始,命运的齿轮开始转动……

扯远了哈哈哈,我重新写这篇文章只是想让去重方式更加严谨(ps:我才不会说是因为技术成长了,看不上之前写的了哈哈哈

方式一:

 依据Set集合的特性,使用set去重(最简洁高效)

/*** 使用set去重** @param list*/
private void setDistinct(List<String> list) {System.out.println("Set 开始去重,条数:" + list.size());List<String> listDistinctResult = new ArrayList<>(new HashSet(list));System.out.println("Set 去重完毕,条数:" + listDistinctResult.size());
}

方式二:

 使用高级的stream流方式去重(可读性高,效率高)

/*** 使用Stream 去重** @param list*/
private void useStreamDistinct(List<String> list) {System.out.println("stream 开始去重,条数:" + list.size());List<String> listDistinctResult = list.stream().distinct().collect(Collectors.toList());System.out.println("stream 去重完毕,条数:" + listDistinctResult.size());
}

方式三:

 使用list.contain去重(效率一般)

/*** 使用 list.contain 去重,返回一个新集合** @param list*/
private void listContainDistinct(List<String> list) {System.out.println("contains 开始去重,旧集合条数:" + list.size());List<String> listDistinctResult = new ArrayList<>();for (String str : list) {if (!listDistinctResult.contains(str)) {listDistinctResult.add(str);}}System.out.println("contains 去重完毕,新集合条数:" + listDistinctResult.size());
}

方式四:

喜闻乐见的for循环去重(最常见,数据量大不建议使用)

/*** 使用for循环去重* @param list*/
private void useForDistinct(List<String> list) {System.out.println("list 双循环 开始去重,条数:" + list.size());for (int i = 0; i < list.size(); i++) {for (int j = i + 1; j < list.size(); j++) {if (list.get(i).equals(list.get(j))) {list.remove(j);}}}System.out.println("list 双循环  去重完毕,条数:" + list.size());
}

特殊情况:

以上都是简单的list集合去重,但是当我们遇到一些特殊情况,比如:当一个集合中存的是Map,Map中有一些键值是重复,而我们需要去除这些重复的对象;以上的三种方式就不太适用了,这种情况就只能使用多层级for循环来做了(这种复杂情况应该可以使用stream来做,不过没试过就不说了),当然数据量大的话肯定效率是比较吃紧的,因此如果在不需要数据实时同步的情况下,可以考虑新开线程去执行这个去重然后走之后的业务流程

这种特殊情况的代码如下:

/*** 数组去重* (目前仅针对于前三列相同进行去重;* 例如:业务层面来讲:即当用户名,身份证,手机号,邮箱等重要信息都相同时,* 去除这一重复数据)* * @param dataList* @return*/private List<Map<Integer, String>> removeSameMapData(List<Map<Integer, String>> dataList) {int i = 0;List<Map<Integer, String>> distinctList = new ArrayList<>();for (Map<Integer, String> map : dataList) {boolean isDuplicate = false;for (Map<Integer, String> distinctMap : distinctList) {for (Map.Entry<Integer, String> entry : map.entrySet()) {Integer key = entry.getKey();if (key <= 3 && StringUtils.equals(map.get(key), distinctMap.get(key))){i ++;}if (i >= 3){i = 0;isDuplicate = true;break;}}}if (!isDuplicate) {distinctList.add(map);}}return distinctList;}

http://www.lryc.cn/news/108364.html

相关文章:

  • AI相机“妙鸭相机”原理分析和手动实现方案
  • 关于计算机大学生秋招面试的那点事?(Golang篇)
  • Windows网络自学的第一天:创建线程
  • 正确的 Java 异常处理
  • RTT(RT-Thread)时钟管理
  • 基础实验篇 | uORB消息读写与自定义实验(二)
  • k8s pod数据存储Volumes
  • ZYNQ在Petalinux系统下双网口同网段的实现
  • 突破传统监测模式:业务状态监控HM的新思路 | 京东云技术团队
  • 7-16 验证“哥德巴赫猜想” (20 分)
  • GEE学习02 --设置Jupyter Notebook的打开路径
  • stm32与上位机电脑间最快的通信方式是什么?
  • pytorch学习——卷积神经网络——以LeNet为例
  • stm32 mpu6050 cubemx DMP法读取角度
  • .Net6 Core Web API 配置 log4net + MySQL
  • 校园跑腿小程序运营攻略
  • InfluxDB2如何求增量数据
  • Flink作业调度的9种状态
  • 8、Kubernetes核心技术 - ConfigMap
  • 音视频--DTMF信号发送及检测
  • 阿里云容器服务助力极氪荣获 FinOps 先锋实践者
  • C++ 通过time.windows.com获取时间
  • MPLAB加载c文件为什么不能添加到工程中的source files中
  • Tcp的粘包和半包问题及解决方案
  • 路由的hash和history模式的区别
  • CS5366+VL171母座正反插HDMI(CS5466也可搭配)国产芯片TYPEC方案设计 ASL电路原理图 集睿致远+威锋设计
  • mxgraph的核心元素详谈
  • 再探C++——默认成员函数
  • 推荐两款github敏感信息搜集工具(gsil、gshark)
  • 如何不拷贝资源的使用fork