当前位置: 首页 > news >正文

哈希冲突

为什么会有哈希冲突?

哈希表通过哈希函数来计算存放数据,在curd数据时不用多次比较,时间复杂度O(1)。但是凡事都有利弊,不同关键字通过相同哈希函数可能计算出来相同的存放地址,这种现象被称为哈希冲突。

如何避免哈希冲突?

1.设计合理的哈希函数
  1. 直接定制法

  1. 取关键字的某个线性函数作为哈希地址:Hash = A * Key + B

  1. 优点:简答,均匀

  1. 缺点:需要事先知道关键字的分布情况,

  1. 适合场景:查找比较小且连续的情况

  1. 除留余数法

设哈希表允许的地址数m,取一个<=m,但最接近或者等于m的质数p作为除数,按照哈希函数Hash = key % p,将关键码转换成哈希地址

2.调节负载因子
负载因子 = 元素个数 / 哈希表的容量

如图所示,负载因子越大,发生哈希冲突的可能性越大。又哈希表中元素不能减少,只能扩大哈希表中的数组容量

解决哈希冲突

如果哈希冲突无法避免,又该如何处理哈希冲突呢?
  1. 开放地址法/闭散列

  1. 线性探测

当发生哈希冲突时,如果哈希表没被装满说明还有空位置,那么可以把key存放到冲突位置的“下一个”空位置。

要往哈希表中插入14,hash(14) = 14 % 10 = 4。已经存放了4,就往下找,直到找到空位置(也就是5下标),24,34,44同理。

缺点:1.线性探测把可能冲突的元素,放到一起,挨得很近。
2.不好删除,如果你删除了4,会影响到44的查找
  1. 二次探测

为了解决线性探测大量冲突元素堆积在一起的缺点,使用函数Hi = (H0 + i2 ) % m (其中i = 1,2,3....).H0 是通过哈希函数对元素关键字Key进行计算得到的位置,m表示哈希表的大小,i表示发生冲突的次数

14的下标 (4 + 12 ) % 10 = 5, 24的下标 (4 + 22 ) % 10 = 8

  1. 开散列/哈希桶/链地址法/开链法

首先对关键码集合用哈希函数计算哈希地址,具有相同地址的关键码归于同一子集合,每个子集合称为一个桶,每个桶里的元素通过一个单链表连接起来,各个链表的头节点存储在哈希表中(即数组+链表)。如果冲突非常严重,每个桶的背后变成一棵红黑树(数组+链表+红黑树)

http://www.lryc.cn/news/38365.html

相关文章:

  • git添加子模块(submodule)
  • C++ 11 pair
  • 反向传播与随机梯度下降
  • 一个conda引起的CPU异常
  • java Date 和 Calendar类 万字详解(通俗易懂)
  • 扩展欧几里得算法及其应用
  • JAVA练习75-全排列
  • Linux下Docker安装mysql-超详细步骤
  • 弹性存储-对象存储OSS部分
  • 强推!30个遥感数据下载网站整理分享
  • 进程系统调用
  • dubbo进阶——服务导出
  • 【竞品分析】如何撰写竞品分析?竞品分析的基本结构?以及优秀的竞品分析案例
  • 海思ubootsd卡协议
  • nuxt3使用总结
  • 指向函数的指针详解,以及如何使用指向函数的指针变量做函数参数
  • Spring——spring整合JUnit
  • 保障信息安全:使用PyZbar库识别二维码图片可以快速获取二维码中的信息,保障信息安全。
  • 从LeNet到ResNet:深入探索卷积神经网络
  • 计算机组成原理_总线标准
  • 蓝桥杯C/C++VIP试题每日一练之芯片测试
  • 树莓派测试wifi与eth速率
  • 关系抽取方面的基础
  • 蓝桥杯嵌入式(G4系列):定时器捕获
  • 多态的定义、重写、原理
  • Angular 配置api代理 proxy 实践
  • ES: 数据增,删,改,批量操作
  • 伯努利方程示例 Python 计算(汽水流体和喷泉工程)
  • 2022年中职网络安全竞赛——应用服务漏洞扫描与利用解析(详细)
  • yyds,Elasticsearch Template自动化管理新索引创建