当前位置: 首页 > news >正文

Java HashMap 扩容机制深度解析

HashMap 的一个关键性能优化就是扩容机制,即在哈希表达到一定负载因子时,自动进行扩容,以保持检索效率。

在这篇文章中,我们将深入研究 HashMap 的扩容机制,了解其原理和影响因素。

1. 初始容量和负载因子

在深入了解 HashMap 的扩容机制之前,我们先了解一下 HashMap 的构造函数中的两个重要参数:

初始容量和负载因子。

public HashMap(int initialCapacity, float loadFactor)

1.1 initialCapacity(初始容量)

表示 HashMap 创建时的容量大小。默认为16,但可以根据预估的元素数量进行调整,以减少扩容次数。

1.2 loadFactor(负载因子)

表示哈希表在达到多少比例的容量时进行扩容。默认为0.75,即当哈希表的实际元素数量达到容量的 75% 时触发扩容。

2. 哈希表和负载因子的关系

HashMap 通过调整负载因子来平衡空间利用率和查找性能。

负载因子越大,哈希表的容量利用率越高,但可能导致哈希冲突增多;负载因子越小,哈希表的容量利用率越低,但减少了哈希冲突的可能性。

3. 扩容触发条件

HashMap 在什么情况下触发扩容呢?当哈希表中的元素数量达到负载因子与当前容量的乘积时,触发扩容操作。

具体公式为:

size > capacity * loadFactor

这时,HashMap 会将容量扩大为当前容量的两倍,并将原有的元素重新分配到新的哈希桶中。

4. 扩容过程

HashMap 的扩容过程并非简单地将数组大小翻倍。具体来说,扩容分为以下几个步骤:

4.1 创建新的哈希表数组

新的容量是原来容量的两倍,并且是大于等于当前元素数量除以负载因子的最小的2的幂。

int newCapacity = oldCapacity << 1;
while (newCapacity < size / loadFactor) {newCapacity <<= 1;
}

数组初始化值是 16,元素达到 12 时进行扩容,2 倍进行扩容后为 32。

4.2 迁移元素

将原哈希表中的元素重新计算哈希码并放入新的哈希表中。

//遍历旧数组
for (int j = 0; j < oldCap; ++j) {Node<K,V> e;if ((e = oldTab[j]) != null) {oldTab[j] = null;if (e.next == null)//hash、数组大小,进行与运算newTab[e.hash & (newCap - 1)] = e;else if (e instanceof TreeNode)((TreeNode<K,V>)e).split(this, newTab, j, oldCap);else { // preserve order//.......}}
}

重新 hash 计算,我们看到 JDK 采用的是与运算,没有采用取模计算,与运算效率更高。

4.3 替换旧的哈希表

扩容完成后,将新的哈希表替换为原来的哈希表。

table = newTable;

5. 扩容过程的性能影响

HashMap 的扩容虽然为了维持性能,但在扩容过程中可能引起性能波动。

在扩容期间,如果有其他线程正在对 HashMap 进行并发修改,可能会导致遍历不一致性或者链表/红黑树的结构异常。这也是为什么在多线程环境中建议使用 ConcurrentHashMap。

6. 性能优化建议

为了减少扩容次数,我们可以在创建 HashMap 时提前设定足够的初始容量。这样可以减少哈希冲突的可能性,延缓扩容操作的发生。

Map<String, Integer> map = new HashMap<>(1024, 0.75f);

总结

通过深入了解 HashMap 扩容原理,合理选择初始容量和负载因子,负载因子参数一般不建议修改,注意并发修改可能引起的问题,都是使用 HashMap 时需要考虑的重要因素。

希望今天的内容对初学 Java 的朋友有所启发或者帮助。各位,有帮助点个赞或在看呀:-),这对我非常重要。

http://www.lryc.cn/news/365810.html

相关文章:

  • 一、Electron 环境初步搭建
  • ffmpeg编码器编码元数据的过程以及编码前后的差异
  • AB测试学习(附有相关代码)
  • 用idea将java文件打成jar包
  • Ansible——group模块
  • Sql注入-报错注入
  • pyqt 回车触发两次editingFinished的解决办法
  • 爬取股票数据python
  • 每日新闻掌握【2024年6月4日 星期二】
  • 智谱AI 发布最新开源模型GLM-4-9B,通用能力超Llama-3-8B,多模态版本比肩GPT-4V
  • 从写简历到谈薪资的最全教程
  • Vue3 响应式API:高级函数(二)
  • 『大模型笔记』什么是提示词注入(Prompt Injection)攻击?
  • SD-WAN与IPSec的对比
  • Ceph入门到精通-ceph经典盘符飘逸问题处理步骤
  • 【CV算法工程师必看】作为一个图像算法工程师,需要会什么,要学哪些技术栈?
  • 【造化弄人:计算机系大学生真的象当年的高速公路收费员一样吗?】
  • 民主测评要做些什么?
  • JimuReport 积木报表 v1.7.5 版本发布,免费的低代码报表
  • Ubuntu安装Protobuf
  • 揭秘Lazada API:掌握数据驱动的电商帝国,轻松实现销售飞跃
  • ThinkPHP发邮件配置教程?群发功能安全吗?
  • 编译和安装OpenMediaVault(OMV)NAS
  • Java【问题 07】SSH不同版本使用jsch问题处理(7.4升级9.7及欧拉原生8.8)
  • k8s和deepflow部署与测试
  • matlab使用教程(92)—流线图、流带图和流管图
  • 全网最全!场外个股期权的询价下单流程的详细解析
  • linux 如何解压 zip
  • 【ubuntu】增加samba服务和文件夹
  • vue3中作用域插槽