当前位置: 首页 > news >正文

可拓展哈希

可拓展哈希

借CMU 15445的ppt截图来说明问题。

我们传统静态hash的过程是hash函数后直接将值存入对应的bucket,但是在可扩展hash中,得查询Directory(左),存入directory指向的bucket(右)。

在这里插入图片描述

下面我们存放key=B,哈希值为hash(B),查询directory知道要放到第二个bucket中。

在这里插入图片描述

然后再放一个key=C(hash( C)的值被老师的视频挡住了,就不放图片了),哈希值为hash( C),并且hash( C)高两位也是10,查询directory也要放到第二个bucket,但此时bucket满了,就将该bucket分裂,其他bucket不用变动,那么directory应该怎么变动呢?分为两种情况(先说明此时hash( C)对应第2种情况)

  1. bucket的local depth < global depth:分裂bucket,改变directory中指向该bucket的指针,让他们分别指向分裂出来的两个bucket,并且这两个bucket的local depth+1
  2. bucket的local depth = global depth:分裂bucket,将directory的大小*2,并且重新分配directory中的指针(这里不知道怎么描述比较好,可以结合下面的图来理解),并且分裂后的两个bucket的local depth+1,global depth+1

很明显hash©对应上面的情况2,因此结果如下:
在这里插入图片描述

第一种情况在课件中没有提到,我也做一下说明(懒得画图了)。我们先回到这张图,基于现在这个状态分析第一种情况:

在这里插入图片描述

假设现在第一个bucket是满的(我们这里假设bucket中第三个为01…),然后hash©=00…,要插入第一个bucket,那么根据情况1,我们将bucket分裂为两个bucket,directory不用增长,但是00…和01…指针分别要指向第一个分裂的bucket和第二个分裂的bucket,第一个分裂桶存放了两个01…,第二个分裂桶存放了两个00…

如果还是不懂的话,可以多看几遍上述操作过程或者看下面的参考链接

简单的体会总结:可拓展哈希好处在于某个桶分裂的时候,不用移动其他桶的元素,减少开销。存在的问题很明显,如果多次插入的hash值相同,分裂肯定是不可行的,因为无论怎么分裂,这几个相同hash值都在同一个bucket中,因此需要用overflow bucket的方式来“打补丁”了,所以最基本的可拓展哈希算法不能直接拿来用,得做点变种吧,不过思想值得学习。

参考链接:

https://blog.csdn.net/qq_37026934/article/details/125368237

https://www.bilibili.com/video/BV1xa41137S4?p=7&vd_source=65dfb8ffc4e0d60f317dcde5b6ceb9fd

https://zhuanlan.zhihu.com/p/375039823

http://www.lryc.cn/news/66288.html

相关文章:

  • Java 版 spring cloud 工程系统管理 +二次开发 工程项目管理系统源码
  • 通过伴随矩阵怎么求逆矩阵
  • 巡检机器人之仪表识别系统
  • 面试官反感的求职者(下)
  • 可视化绘图技巧100篇分析篇(二)-生存曲线(LM曲线)(补充篇)
  • 【100%通过率 】【华为OD机试python】钟表重合时刻【 2023 Q1考试题 A卷|100分】
  • Java线程池编码示例
  • 如何优化Android 4.x系统设置字体大小
  • Docker安装、Docker基本操作
  • 系统集成项目管理工程师知识点总结
  • 【游戏里的网络同步分析】马里奥制造2 多人模式
  • SSM框架学习-注解开发第三方bean管理
  • 【数据结构与算法】图——邻接表与邻接矩阵
  • 网安笔记02 密码学基础
  • open3d io操作
  • 【Linux】Linux安装Redis(图文解说详细版)
  • setTimeout不准时,CSS精准实现计时器功能
  • 单细胞跨模态分析综述
  • 【零基础学机器学习 1】什么是机器学习?
  • ARM处理器与中断——嵌入式(驱动)软开基础(一)
  • WX小程序 - 2
  • 开源之夏2023 | 欢迎申请openEuler Embedded SIG开发任务
  • 【异常解决】vim编辑文件时提示 Found a swap file by the name “.start.sh.swp“的解决方案
  • 「企业应用架构」应用架构概述
  • ePWM模块(3)
  • 【笔试强训选择题】Day11.习题(错题)解析
  • JVM知识
  • 操作系统第二章——进程与线程(中)
  • AlphaFold的极限:高中生揭示人工智能在生物信息学挑战中的缺陷
  • RocketMQ双主双从环境搭建