当前位置: 首页 > news >正文

从零开始的C++(二十)

哈希:

用于unorder_map和unorder_set,其本身是一种思想,即通过一个值利用某种算法去映射到另一个值上。利用哈希思想具体实现的是哈希表。

哈希通常函数:插入和查找

1.插入:用某种算法算出插入值对应的插入下标。

2.查找:利用插入的算法找出待查找的值可能出现的下标。

哈希冲突:

概念:不同的数通过算法计算出的插入下标相同,此时发生哈希冲突。

一般来说数的个数越多越容易发生冲突,有点类似雀巢原理?

解决哈希冲突:

法一:开散列

相同下标的元素放在同一个链表中,此时该链表中所有元素共同为一个桶,每个桶中所有元素彼此哈希冲突。

法二:闭散列

发生哈希冲突时,后插入的元素依次往下标+1、+2...的空闲位置放(线性探测),也也可以往下标+1、下标+4、下标+9...的空闲位置差(二次探测)

哈希扩容:

当插入元素很多时,哈希冲突的概率会越来愈大,为了减少哈希冲突概率,需要扩容。对于开散列,一般在原本链表数组基础上扩容,然后直接将链表上所有元素重新插入。对于闭散列,一般开一份新空间,其长度是原本数组二倍,然后复用插入函数将原数组上的元素拷贝一份放到新空间,后释放原数组,指向新数组。

位图:

一种基于哈希思想的应用,用于海量整形数据的查找、判断是否存在。

原理:每一个数用一个比特位表示是否存在,极大程度减少所占空间。插入时通过一个函数。将整形数据映射到对应比特位上。查找时只需根据函数判断对应比特位是否为1即可。

缺陷:位图只能用于全是整形数据,例如字符串之类的不能使用。

针对位图的缺陷,有了布隆过滤器。

布隆过滤器:

对于字符串,会先通过一个算法转换成对应的一个整形数据,在通过哈希函数找出对应下标(比特位)。

缺陷:虽然可以适用于字符串等非整形类型,但是仍然会有哈希冲突的存在,如不同字符串对应的下标相同。因此只能正确判断字符串不在,无法百分百判断字符串是不是在。(存在误判),因此在查找一个字符串时可以过滤掉不在的数,不能过滤掉可能在的数,因此是过滤器。

布隆过滤器一般无法进行删除,因为不同字符串可能对应同一个下标,若删除可能导致错误。若想要实现删除,需要额外增加一个计数位置,记录当前有几个字符串在此下标,但这样又会额外开辟大量空间。

http://www.lryc.cn/news/250010.html

相关文章:

  • shell编程系列(8)-使用sed处理文本
  • NDK是什么?有什么用?需要掌握什么技术栈?
  • 《代码长寿经:程序员养生指南》
  • 统计素数并求和(Python)
  • 新建的springboot项目中application.xml没有绿色小叶子(不可用)
  • powershell获取微软o365 21v日志
  • 整体迁移SVN仓库到新的windows服务器
  • D365 CRM Power Platform 后端开发概览
  • 【Java 并发编程】进程线程、lock、设计模式、线程池...
  • 【axios】拦截器:axios.interceptors.request.use|axios.interceptors.response.use
  • webrtc兼容android4.x的一次探索
  • Kafka的存储机制和可靠性
  • 数据库时间类型之间的转换魔法
  • conda和pip常用命令整理
  • 英语翻译小软件 ← Python实现
  • 将项目放到gitee上
  • 【机器视觉技术】:开创人工智能新时代
  • 网易区块链,网易区块链赋能赣州脐橙数字藏品,数字指纹解决方案
  • 程序员如何兼职?
  • 教育企业CRM选择技巧
  • 算法:Java计算二叉树从根节点到叶子结点的最大路径和
  • 袖珍可穿戴手持气象仪是什么?
  • 【Azure 架构师学习笔记】- Azure Databricks (1) - 环境搭建
  • 无需繁琐编程 开启高效数据分析之旅!
  • JOSEF约瑟 剩余电流保护器 CLJ3-100A+LH30 导轨安装
  • vue3自定义指令-文本超出宽度滚动
  • uniapp在H5端实现PDF和视频的上传、预览、下载
  • Kafka报错under-replicated partitions
  • 【Python基础】字符集与字符编码
  • C# AES-128-CBC 加密