当前位置: 首页 > news >正文

数据结构—散列表的查找

7.4散列表的查找

7.4.1散列表的基本概念

基本思想:记录的存储位置域关键字之间存在对应关系

​ 对应关系——hash函数

​ Loc(i)= H(keyi)

如何查找

什么是散列表 - 知乎

根据散列函数 H(key) = k

查找key=9,则访问H(4)= 18号地址,若内容为18则成功;

若查不到,则返回一个特殊值,如空指针或空记录。

优点:查找效率高

缺点:空间效率低

7.4.2散列表的若干术语

散列方法(杂凑法)

​ 选取某个函数,依该函数按关键字计算元素的存储位置,并按此存放;

​ 查找时,由同一个函数对给定值K计算地址,将k与地址单元中元素关键码进行比,确定查找是否成功。

散列函数(杂凑函数):散列方法中使用的转换函数

散列表(杂凑表):按上述思想构造的表 散列函数:H(key)=k

什么是散列表 - 知乎

冲突:不同的关键码映射到同一个散列地址 key1≠key2,但是H(key1)=H(key2)

例如:有6个元素的关键码分别为:(25,21,39,9,23,11)。

  • 选取关键码与元素位置间的函数为H(k)=k mod 7,
  • 地址编号从0-6

7.4.3散列函数的构造方法

散列存储:选取某个函数,依该函数按关键字计算元素的存储位置

Loc(i)=H(keyi)

在散列查找方法中,冲突是不可能避免的,只能尽可能减少。

使用散列表要解决好两个问题

  1. 构造好的散列函数

    a)所选函数尽可能简单,以便提高转换速度;

    b)所选函数对关键码计算出的地址,应在散列地址集中致均匀分布,以减少空间浪费。

  2. 制定一个好的解决冲突的方案

    查找时,如果从散列函数计算出的地址中查不到关键码,则应当依据解决冲突的规则,有规律地查询其他相关单元。

构造散列函数考虑的因素

  1. 执行速度(即计算散列函数所需要的时间);
  2. 关键字的长度;
  3. 散列表的长度;
  4. 关键字的分布情况;
  5. 查找频率。

根据元素集合的特性构造

  • 要求一:n 个数据源仅占用 n 个地址,虽然散列查找是以空间换时间,但仍希望散列的地址空间尽量小
  • 要求二:无论用什么方法存储,目的都是尽量均匀地存放元素,以避免冲突。
1、直接定址法

Hash(key)= a·key + b (a、b为常数)

优点:以关键码key的某个线性函数值为散列地址,不会产生冲突。

缺点:要占用连续地址空间,空间效率低。

教你几招HASH表查找的方法 - 知乎

2、除留余数法

Hash(key)= key mod p(p是一个整数)

关键:如何选取合适的p?

技巧:设表长为m,取p≤m且为质数

哈希 ---《哈希函数》------除数的选取为什么是质数?、《哈希冲突》------解决方法、《闭散列》、《开散列》_除留余数法为什么用质数 ...

7.4.4处理冲突的方法

1、开放地址法(开地址法)

基本思想:有冲突时就去寻找下一个空的散列地址,只要散列表足够大,空的散列地址总能找到,并将数据元素存入。

例如:除留余数法 Hi=(Hash(key)+di) mod m di为增量序列

常用方法:

​ 线性探测法 di为1,2,…m-1线性序列 一旦冲突,就找下一个地址,直到找到空地址存入

【数据结构】哈希表(线性探测法)_LI大大的博客-CSDN博客_线性探测法

​ 二次探测法 di为12,-12,22,-22,…,q2二次序列

详细图解什么叫平方探查法即二次探测再散列和线性探测再散列(数据结构 哈希函数 哈希冲突)_请叫我大师兄_的博客-CSDN博客_二次探测再散列是 ...

​ 伪随机探测法 di为伪随机数序列

2、链地址法(拉链法)

基本思想:相同散列地址的记录链成一单链表

m个散列地址就设m个单链表,然后用一个数组将m个单链表的表头指针存储起来,形成一个动态的结构。

【数据结构和算法】散列表的查找算法(开放地址法,链地址法)-阿里云开发者社区

链地址法建立散列表步骤

  • Step1:取数据元素的关键字key,计算其散列函数值(地址)。若该地址对应的链表为空,则将该元素插入此链表;否则执行Step2解决冲突。
  • Step2:根据选择的冲突处理方法,计算关键字key的下一个存储地址。若该地址对应的链表不为空,则利用链表的前插法或后插法将该元素插入此链表。

链地址法的优点

  • 非同义词不会冲突,无聚集现象
  • 链表上结点空间动态申请,更适合于表长不确定的情况

7.4.5散列表的查找

给定值查找值k,查找过程:

《算法与数据结构基础》学习笔记07——查找算法_线性表、树表、散列表的查找 - 知乎

【数据结构和算法】散列表的查找算法(开放地址法,链地址法) - 程序员大本营

http://www.lryc.cn/news/127831.html

相关文章:

  • Expo项目 使用Native base UI库
  • 74、75、76——tomcat项目实战
  • jmeter errstr :“unsupported field type for multipart.FileHeader“
  • C#调用C++ DLL传参byte[]数组字节值大于127时会变为0x3f的问题解决
  • 【vue3+xlxs+xlsx-style-vite】vue3项目中使用xlsx插件实现Excel表格的导出和解析,已实现
  • Doris2.0时代的一些机遇和挑战!
  • Leetcode-每日一题【剑指 Offer 32 - I. 从上到下打印二叉树】
  • 网神 SecGate 3600 防火墙任意文件上传漏洞复现
  • 把独显塞回CPU,新核显能够媲美RTX 30、40系显卡了
  • Python爬虫——scrapy_工作原理
  • gRPC vs REST:创建API的方法比较
  • 缓存平均的两种算法
  • SpringBoot的配置文件(properties与yml)
  • 如何应用项目管理软件进行敏捷开发管理
  • ARM DIY 硬件调试
  • DataFrame.rename()函数--Pandas
  • 09- DMA(DirectMemoryAccess直接存储器访问)
  • 责任链模式
  • 【BI看板】Docker-compose安装Superset,安装最新版本2.1.0
  • VS2019生成的DLL,给QT(MinGW版本)使用的小结
  • c++--SLT六大组件之间的关系
  • 解析个人信息保护影响评估
  • 2.阿里云对象存储OSS
  • (三)Unity开发Vision Pro——入门
  • 召集令:CloudQuery 社区有奖征文活动来啦!
  • 【傅里叶级数与傅里叶变换】数学推导——1、基础知识点回顾及[Part1:三角函数的正交性]介绍
  • BUUCTF [MRCTF2020]Ezpop解题思路
  • 【IMX6ULL驱动开发学习】07.驱动程序分离的思想之平台总线设备驱动模型和设备树
  • 深度学习中的python语法笔记总结
  • Reids 的整合使用