当前位置：首页 > news >正文

Python 字典为什么查询高效

news 2025/8/3 19:22:39

Python 字典（dict）之所以查询效率非常高（平均时间复杂度为 O(1)），主要归功于其底层实现——哈希表（Hash Table）。

1. 核心：哈希表（Hash Table）

字典本质上是一个哈希表。哈希表是一种通过键（key） 直接映射到值（value） 存储位置的数据结构。

工作流程：

哈希函数（Hash Function）：
- 当你向字典中插入一个键值对（如 d['name'] = 'Alice'）时，Python 会先对键 'name' 调用其 __hash__() 方法，得到一个整数，称为哈希值（hash value）
- 这个哈希值是确定性的：同一个键，每次计算得到的哈希值都相同。
- 不可变类型（如 str, int, tuple）都有 __hash__ 方法，因此可以作为字典的键；而可变类型（如 list, dict）没有，所以不能作为键。
索引计算（Indexing）：
- 哈希值通常是一个很大的整数，不能直接用作数组下标。
- Python 会将哈希值通过一个函数（通常是取模运算）映射到哈希表的槽位（slot） 索引上。例如：index = hash(key) % table_size。
存储/查找：
- Python 直接访问计算出的索引位置，将值存储进去（插入）或读取出来（查找）。
- 由于数组的索引访问是 O(1) 操作，所以字典的查找/插入/删除平均也是 O(1)。

2. 处理哈希冲突（Collision）

不同的键可能产生相同的哈希值（或映射到同一索引），这称为哈希冲突。Python 字典使用了两种主要技术来解决：

a. 开放寻址法（Open Addressing）

Python 字典主要使用基于开放寻址的哈希表。
当目标槽位已被占用时，它会按照一定的探测序列（如线性探测、二次探测）寻找下一个空闲槽位。
Python 使用了一种优化的探测方式，能有效减少“聚集”（clustering）问题。

b. 键值对存储结构

Python 字典的底层结构设计巧妙，它将哈希值、键、值作为一个整体存储。
在查找时，即使索引位置被占用，Python 会先比较哈希值，如果不同则直接跳过；如果相同，再比较键是否相等（==）。
这种“先比哈希，再比键”的方式大大加快了查找速度，尤其是在哈希冲突较多时。

3. 动态扩容（Resizing）

哈希表的大小是固定的，但字典是动态的。
当字典中元素过多，导致装载因子（元素数 / 槽位数）过高时，哈希冲突概率上升，性能下降。
Python 会在装载因子达到一定阈值（如 2/3）时，自动扩容：创建一个更大的哈希表，并将所有键值对重新哈希到新表中。

http://www.lryc.cn/news/608535.html

相关文章：

Python 全局解释器锁

如何在`＜link type=“icon“ href=`的`href`中写SVG并使用path标签? 笔记250802

C++：std::array vs 原生数组 vs std::vector

通俗易懂解释Java8 HashMap

计数组合学7.11（RSK算法)

人工智能与农业：智慧农业的发展与未来

数据集-目标检测系列- 地球仪数据集 globe＞＞ DataBall

SmartCLIP：具有识别保证的模块化视觉-语言对齐

代码随想录刷题Day23

linux 启动流程？

拉格朗日插值法

数据库理论

深入 Go 底层原理（七）：逃逸分析

商品中台数据库设计

Flutter dart运算符

【Leetcode】2561. 重排水果

嵌入式第十八课！！数据结构篇入门及单向链表

数据结构（12）二叉树

计算学习理论（PAC学习、有限假设空间、VC维、Rademacher复杂度、稳定性）

Java内存模型（Java Memory Model，JMM）

网安-中间件-weblogic（updating..）

数据结构初学习、单向链表

暑期算法训练.13

什么是DOM和BOM？

智能手表：电源检查

入门MicroPython+ESP32：安装逗脑IDE及驱动

JVM 03 类加载机制

堆----1.数组中的第K个最大元素

高效游戏状态管理：使用双模式位运算与数学运算

关于人工智能AI＞ML＞DL＞transformer及NLP的关系