当前位置: 首页 > news >正文

JAVA:HashMap在1.8做了哪些优化的详细解析

1、简述

HashMap 是 Java 中最常用的数据结构之一,它以键值对的形式存储数据,允许快速的插入、删除和查找操作。在 JDK 1.8 之前,HashMap 主要是基于数组加链表的结构实现的。然而,在面对大量哈希冲突时(即多个键的哈希值相同时),链表可能会变得非常长,导致查询效率从 O(1) 退化为 O(n)。为了优化这种情况,JDK 1.8 对 HashMap 进行了几个重要的改进,主要包括引入红黑树(Red-Black Tree)和哈希算法的改进。本文将详细讲解这些优化及其背后的设计思路。
在这里插入图片描述

2、JDK 1.8 之前的 HashMap 实现

在 JDK 1.8 之前,HashMap 使用数组和链表的组合结构。当我们插入一个元素时,它首先通过键的哈希值确定数组中的位置(称为桶),如果该位置存在其他元素,新的键值对将被追加到该位置的链表上。

这种结构的优点是简单易实现,且在键分布均匀的情况下性能很好。但在极端情况下,如果大量的键映射到了同一个位置(哈希冲突),链表的长度会增长,查询时间复杂度会从 O(1) 退化到 O(n),这对性能影响较大。

在这里插入图片描述

3、JDK 1.8 对 HashMap 的优化

3.1 引入红黑树(Red-Black Tree)

为了优化链表查询的效率,JDK 1.8 引入了红黑树。当链表的长度超过一定阈值(默认是 8)时,链表会自动转换为红黑树。红黑树是一种自平衡二叉搜索树,查找、插入、删除操作的时间复杂度为 O(log n),因此大幅提升了查询性能。

当链表中的元素少于一定数量(默认是 6)时,红黑树会被转换回链表。这种转换机制在哈希冲突较严重时显著提升了 HashMap 的性能,同时也保证了在数据量较少时的内存开销不会过高。

// HashMap 中的链表转红黑树逻辑示例
if (binCount >= TREEIFY_THRESHOLD) {treeifyBin(tab, hash);
}
  • TREEIFY_THRESHOLD:定义了链表转化为红黑树的阈值,默认值为 8。
  • treeifyBin:负责将链表转化为红黑树。
3.2 动态扩容优化

HashMap 的容量是动态扩展的,当哈希表中的元素数量超过当前容量的 75% 时,会触发扩容操作。在 JDK 1.8 之前,扩容需要重新计算每个键的哈希值并分配到新的位置。JDK 1.8 优化了扩容逻辑,通过更高效的方式重新分配元素。

扩容时,原数组长度翻倍,每个元素要么保持在原位置,要么移动到新的索引位置。通过与新的容量进行简单的按位与运算,JDK 1.8 能快速确定元素在新数组中的位置,从而避免重新计算哈希值,提升了扩容的效率。

// HashMap 扩容时的元素迁移逻辑
int idx = e.hash & (newCapacity - 1);
3.3 改进的哈希算法

在 JDK 1.8 中,HashMap 采用了更好的哈希扰动函数(hash function),目的是减少哈希冲突的发生。通过对哈希值进行一系列位运算,使得高位和低位都能影响最终的数组索引,减少了低质量哈希函数带来的冲突问题。

static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

这一优化主要是通过异或操作,将高位和低位的信息混合在一起,以提高哈希值的随机性,进而降低哈希冲突的概率。

4、优化的性能影响

JDK 1.8 的这些改进显著提升了 HashMap 在大数据量、高冲突场景下的性能:

  • 在链表转换为红黑树后,查找性能从 O(n) 提升为 O(log n),尤其在高冲突情况下,性能提升明显。
  • 动态扩容时避免了重复计算哈希值,扩容效率得到了提升。
  • 改进的哈希算法进一步减少了哈希冲突的概率,提高了哈希表的整体性能。

以下是一个简单的示例代码,展示了 HashMap 在 JDK 1.8 中的工作机制:

import java.util.HashMap;public class HashMapDemo {public static void main(String[] args) {HashMap<String, Integer> map = new HashMap<>();// 插入元素,触发红黑树转换for (int i = 0; i < 20; i++) {map.put("key" + i, i);}// 输出 HashMap 内容map.forEach((key, value) -> System.out.println(key + ": " + value));// 扩容前后检查性能System.out.println("Size before expansion: " + map.size());for (int i = 20; i < 50; i++) {map.put("key" + i, i);}System.out.println("Size after expansion: " + map.size());}
}

5、总结

JDK 1.8 对 HashMap 的优化主要集中在两个方面:提高哈希冲突情况下的查找效率和优化扩容过程。通过引入红黑树结构,HashMap 能够在面对大量哈希冲突时依然保持高效的查询性能;而动态扩容的优化则减少了不必要的哈希值重计算操作。这些优化使得 HashMap 在 JDK 1.8 中性能更加稳定和高效,特别是在大数据量的高并发环境中,表现尤为出色。

这也是为什么在性能敏感的系统中,升级到 JDK 1.8 后 HashMap 的表现更加优越的原因。希望这篇文章能帮助你更好地理解这些优化的实现原理,并在实际开发中加以应用。

http://www.lryc.cn/news/515634.html

相关文章:

  • jest使用__mocks__设置模拟函数不生效 解决方案
  • javaEE-网络原理-1初识
  • 笔上云世界微服务版
  • linux安装redis及Python操作redis
  • node.js内置模块之---stream 模块
  • 《learn_the_architecture_-_aarch64_exception_model》学习笔记
  • 【C++项目实战】贪吃蛇小游戏
  • Python基于matplotlib实现树形图的绘制
  • 【UE5 C++课程系列笔记】21——弱指针的简单使用
  • 【游戏设计原理】46 - 魔杖
  • 【路径跟踪】PIDMPC
  • Spring源码分析之事件机制——观察者模式(二)
  • 热备份路由HSRP及配置案例
  • 仿生的群体智能算法总结之三(十种)
  • CentOS 7系统 OpenSSH和OpenSSL版本升级指南
  • 【专题】2024年出口跨境电商促销趋势白皮书报告汇总PDF洞察(附原数据表)
  • 【Ubuntu】不能连上网络
  • CSS3 框大小
  • 联发科MTK6771/MT6771安卓核心板规格参数介绍
  • python中的时间模块--datetime模块、time模块
  • CV 处理全流程:从数据采集到模型部署的整个过程,体现全面性
  • OWASP ZAP之API 请求基础知识
  • 南京观海微电子----GH7009国宇测试盒使用
  • mysql及其兼容语法数据库对于注释的特殊要求
  • 数据去重与重复数据的高效处理策略
  • Spring Boot自动装配代码详解
  • 渗透测试-非寻常漏洞案例
  • 122. 买卖股票的最佳时机 II
  • Python爬虫入门指南:从零开始抓取数据
  • Android使用JAVA调用JNI原生C++方法