当前位置: 首页 > news >正文

「C++笔记」unordered_map:哈希化的无序映射函数(键值对)

unordered_map 是 C++ 中一个经过哈希函数(Hash)处理的映射(map)容器。

本文中的mapset是差不多的,unordered_mapunordered_set也是对应的。所以不再单独写一篇了。

这里的内容建议看完本文之后再回过头来看
二者虽然都有两个属性,但是程序员定义的时候数目不一样。
set是一种属性的容器,就像字典你定好“字”,页数是后面放的位置确定的。但是map是由两个属性确定的,所以也被称为键值对(key-value pairs)。
此外,unordered_set官方不建议修改元素值,因为修改之后,哈希值可能会发生变化,这样就出问题了。需要的话,删除再加就行了。但是unordered_map并没有这种提示。

为什么会有个无序的map

据《A Tour of C++ Third Edition》中描述,使用unordered_map而非map是因为在很多情况下,使用处理过的数据查询速度要比有序的快很多。其实这很容易理解,不过这里要先说明一下map是什么样的。

C++ 中的 map 其实就是某些语言里的字典(dictionary)、关联数组(associative array)。

map 实际上是一个平衡二叉树(通常会使用红黑树),如下:

请添加图片描述

二叉树的查询时间是 O ( log ⁡ ( n ) ) O(\log(n)) O(log(n)),假设有 1000000 个元素,那么最多只要 20 步就能找到这个元素。

这导致了一个现象:在很多时候,经过哈希函数处理的元素排列要比顺序的元素排列快很多。

经过哈希函数处理的元素排列是乱序的,这也是函数名中的“unordered”的由来。
unordered_map其实就是个哈希表。

举个例子,一个 1000000 个元素序列是升序的,那么如果查询的内容大多是较大的数,实际查询次数基本上都会超过 10 次。而经过哈希函数处理的乱序序列可能有的不足 10 次,有的超过 10 次,会比较平均。

正因如此,C++ 搞了个unordered_map避免这种问题。unordered_map结构如下:
请添加图片描述

unordered_map是通过标准库<hash>实现的,这部分内容你可以看看书中的内容,Bjarne Stroustrup 进行了一些简单地说明。书中基本上在强调找到一个好的 hash 函数是核心,因为只有这个函数好(适合要应用的数据), 乱序才能比顺序快。

举个🌰(使用方法)

下面是官方文档中的一个例子,个人感觉非常全面,就不再自己想了。那么就通过这个例子来说明一下如何使用unordered_map

头文件如下:

#include <iostream>
#include <string>
#include <unordered_map>

main()主函数中,首先创建一个unordered_map,两个属性都是字符串,拥有3个元素:

std::unordered_map<std::string, std::string> u =
{{"RED", "#FF0000"},{"GREEN", "#00FF00"},    {"BLUE", "#0000FF"}
};

接下来官方声明了一个lambda帮助函数(Helper lambda function)来打印键值对,这样可以大大减少后续输出时的代码量:

auto print_key_value = [](const auto& key, const auto& value)
{std::cout << "Key:[" << key << "] Value:[" << value << "]\n";
};

接下来有两种打印方式:第一种是普通的,第二种是 C++17 的结构化绑定(structured binding),个人推荐第二种:

for (const std::pair<const std::string, std::string>& n : u)print_key_value(n.first, n.second);for (const auto& [key, value] : u)print_key_value(key, value);

此时输出为:

Key:[BLUE] Value:[#0000FF]
Key:[GREEN] Value:[#00FF00]
Key:[RED] Value:[#FF0000]

如果想给这个unordered_map添加两个新的键值对,那么直接使用下面的方法就行:

u["BLACK"] = "#000000";
u["WHITE"] = "#FFFFFF";

这样就已经添加了,你可以打印一下看看,输出如下:

Key:[BLACK] Value:[#000000]	<-----这个是新插入的
Key:[BLUE] Value:[#0000FF]
Key:[WHITE] Value:[#FFFFFF]	<-----这个是新插入的
Key:[GREEN] Value:[#00FF00]
Key:[RED] Value:[#FF0000]

这里你可以看到,BLACKWHITE并不是按照顺序插入到最后的,这里体现了它的“unordered”,而这是它的哈希函数做的。

除此之外,如果你对一个不存在的键(key)使用运算符[],那么会插入一个新的键值对:

print_key_value("new_key", u["new_key"]);

执行完这行代码之后,如果你想输出请使用auto类型,因为这里的键值对里的值并没有设置,如果使用前面的输出代码可能会报错(不过这个例子并没有出现错误),这里官方输出代码如下:

for (const auto& n : u)print_key_value(n.first, n.second);

此时输出如下:

Key:[new_key] Value:[]	<-----这个是新插入的
Key:[GREEN] Value:[#00FF00]
Key:[BLACK] Value:[#000000]
Key:[BLUE] Value:[#0000FF]
Key:[WHITE] Value:[#FFFFFF]
Key:[RED] Value:[#FF0000]

如果你想借此机会插入一个键值对,可以使用下面的代码:

print_key_value("new_key", u["new_key"]="#123456");for (const auto& n : u)print_key_value(n.first, n.second);

此时输出为:

Key:[new_key] Value:[#123456]	<-----这个是新插入的
Key:[GREEN] Value:[#00FF00]
Key:[BLACK] Value:[#000000]
Key:[BLUE] Value:[#0000FF]
Key:[WHITE] Value:[#FFFFFF]
Key:[RED] Value:[#FF0000]

需要注意不能写成下面这样,因为是[]操作符实现新建键值对的,而这样没有使用[]

print_key_value("new_key", u["#123456");for (const auto& n : u)print_key_value(n.first, n.second);

此时输出结果为:

Key:[BLACK] Value:[#000000]	<-----这个是新插入的
Key:[BLUE] Value:[#0000FF]
Key:[WHITE] Value:[#FFFFFF]
Key:[GREEN] Value:[#00FF00]
Key:[RED] Value:[#FF0000]

可以看到值并不是我们想要的#123456

完整代码

#include <iostream>
#include <string>
#include <unordered_map>int main()
{// 创建一个unordered_map,两个属性都是字符串,拥有3个元素。std::unordered_map<std::string, std::string> u ={{"RED", "#FF0000"},{"GREEN", "#00FF00"},{"BLUE", "#0000FF"}};//print_key_value是一个lambda帮助函数(Helper lambda function)用来打印键值对//这样可以大大减少后续输出时的代码量auto print_key_value = [](const auto& key, const auto& value){std::cout << "Key:[" << key << "] Value:[" << value << "]\n";};std::cout << "迭代并打印unordered_map的键值对,并且显示其类型:\n";for (const std::pair<const std::string, std::string>& n : u)print_key_value(n.first, n.second);std::cout << "\n使用C++17结构化绑定(structured binding)迭代和打印键值对:\n";for (const auto& [key, value] : u)print_key_value(key, value);// 向unordered_map添加两个新条目u["BLACK"] = "#000000";u["WHITE"] = "#FFFFFF";for (const auto& [key, value] : u)print_key_value(key, value);std::cout << "\n通过键(key)输出值:\n""RED的HEX:[" << u["RED"] << "]\n""BLACK的HEX:[" << u["BLACK"] << "]\n\n";std::cout << "对不存在的键(key)使用运算符[]插入新的键值对:\n";print_key_value("new_key", u["new_key"]);std::cout << "\n使用`auto`类型迭代打印键值对;“new_key现在是映射中的键(key):\n";for (const auto& n : u)print_key_value(n.first, n.second);
}

希望能帮到有需要的人~

参考资料

《A Tour of C++ Third Edition》:6.5.6 hash<>,12.6 unordered_map。

C++ unordered_set 和 unordered_map 的中文官方文档,很多本文没有提到的功能都可以自行查看这里:
std::unordered_set - cppreference.com
std::unordered_map- cppreference.com

http://www.lryc.cn/news/515451.html

相关文章:

  • Linux 安装jdk
  • asp.net core 发布到iis后,一直500.19,IIS设置没问题,安装了sdk,文件夹权限都有,还是报错
  • 【Go】运行自己的第一个Go程序
  • qt qss文件的使用
  • 【管道——二分+区间合并】
  • 宽带、光猫、路由器、WiFi、光纤之间的关系
  • 如何排查 Apache Doris 中 “Failed to commit txn“ 导入失败问题?
  • 回归预测 | MATLAB实现CNN-GRU卷积门控循环单元多输入单输出回归预测
  • HCIA-Access V2.5_7_3_XG(S)原理_关键技术
  • leetcode hot 100 不同路径
  • 智慧工地解决方案 1
  • LeetCode -Hot100 - 53. 最大子数组和
  • php 多进程那点事,用 swoole 如何解决呢 ?
  • 探索AI在地质科研绘图中的应用:ChatGPT与Midjourney绘图流程与效果对比
  • 【竞技宝】CS2:HLTV 2024 TOP11-w0nderful
  • Lua迭代器如何使用?
  • qt中如何判断字符串是否为数字,整数,浮点数?
  • Oracle sql developer and Toad for Oracle set start DBMS output
  • 【踩坑】SparkSQL union/unionAll 函数的去重问题
  • 域上的多项式环,整除,相通,互质
  • 计算机毕业设计PyHive+Hadoop深圳共享单车预测系统 共享单车数据分析可视化大屏 共享单车爬虫 共享单车数据仓库 机器学习 深度学习
  • Julia语言的学习路线
  • 对计网大题的一些指正(中间介绍一下CDM的原理和应用)
  • UGUI 优化DrawCall操作记录(基于Unity2021.3.18)
  • 前端实现大文件上传(文件分片、文件hash、并发上传、断点续传、进度监控和错误处理,含nodejs)
  • es单机安装脚本自动化
  • Java 数据库连接 - Sqlite
  • CentOS — 目录管理
  • 【第二部分--Python之基础】04 函数
  • 我们公司只有3个人,一个前端,一个后端