当前位置: 首页 > news >正文

一文详解Mysql索引

背景

        索引是存储引擎用于快速找到一条记录的数据结构。索引对良好的性能非常关键。尤其是当表中的数据量越来越大时,索引对性能的影响愈发重要。接下来,就来详细探索一下索引。

索引是什么

        索引(Index)是帮助数据库高效获取数据的数据结构。它们被用作包含所关心数据的表指针,通过一个索引,能从表中直接找到一个特定的记录,而不必连续顺序扫描这个表。

索引的分类

        索引有很多种类型,可以为不同的场景提供更好的性能。在Mysql中,索引是存储在引擎层而不是服务器层实现的,所以不同的存储引擎有不同的实现,并没有统一的索引标准。

按照存储结构划分

B-Tree 索引(B-树索引)

B-Tree 索引是最常见的索引类型,几乎所有的数据库系统都支持这种索引。B-Tree 索引是一种平衡树结构,能够保持数据的有序性,并且支持高效的查找、插入和删除操作。

特点:
  • 平衡性:B-Tree 是一种平衡树,所有叶子节点的深度相同。
  • 多路性:每个节点可以有多个子节点,这样可以减少树的高度,从而减少查找路径。
  • 顺序访问:B-Tree 的叶子节点之间通过指针相连,支持顺序访问。
优点:
  • 支持范围查询和排序操作。
  • 插入和删除操作较为高效。
缺点:
  • 维护平衡树的结构需要一定的开销。
  • 对于频繁的插入和删除操作,性能可能会有所下降。

2. B+Tree 索引(B+树索引)

B+Tree 是 B-Tree 的变种,是数据库系统中最常用的索引类型。B+Tree 在 B-Tree 的基础上进行了优化,使其更适合磁盘存储和范围查询。

特点:
  • 非叶子节点只存储键值信息:非叶子节点不存储数据,只存储键值和指向子节点的指针。
  • 叶子节点存储数据:所有数据都存储在叶子节点中,叶子节点之间通过指针相连,形成一个双向链表。
  • 顺序访问指针:叶子节点之间有顺序访问指针,支持高效的范围查询。
优点:
  • 支持高效的范围查询和排序操作。
  • 由于非叶子节点只存储键值信息,可以存储更多的键值,从而减少树的高度,提高查找效率。
缺点:
  • 维护树的平衡结构需要一定的开销。
  • 对于频繁的插入和删除操作,性能可能会有所下降。

3. Hash 索引

Hash 索引基于哈希表实现,通过哈希函数将键值映射到哈希表中的位置,从而实现快速查找。

特点:
  • 哈希函数:通过哈希函数将键值映射到哈希表中的位置。
  • 等值查询:适用于等值查询,不支持范围查询。
优点:
  • 查找速度非常快,时间复杂度为 O(1)。
  • 哈希表结构紧凑,占用空间较小。
缺点:
  • 不支持范围查询和排序操作。
  • 当发生哈希冲突时,性能会下降。
  • 需要处理哈希冲突的问题。

4. R-Tree 索引(R-树索引)

R-Tree 索引主要用于多维数据的存储和查询,常用于地理信息系统(GIS)和空间数据库中。

特点:
  • 多维数据:支持多维数据的存储和查询。
  • 空间查询:适用于范围查询、邻近查询和包含查询等空间查询操作。
优点:
  • 支持高效的多维数据查询。
  • 适用于地理信息系统和空间数据库。
缺点:
  • 维护树的结构需要一定的开销。
  • 对于高维数据,性能可能会下降。

5. 全文索引(Full-Text 索引)

全文索引用于对文本数据进行全文搜索,适用于大文本字段的模糊查询。

特点:
  • 关键词搜索:支持对文本数据中的关键词进行搜索。
  • 倒排索引:通常使用倒排索引来实现全文搜索。
优点:
  • 支持高效的全文搜索。
  • 适用于大文本字段的模糊查询。
缺点:
  • 创建和维护全文索引需要一定的开销。
  • 对于小文本字段,全文索引的优势不明显。

按照逻辑功能划分

  1. 普通索引:最基本的索引类型,没有唯一性之类的限制。用于加速对表中数据的查询。
  2. 唯一索引:不允许其中任何两行具有相同索引值的索引。用于确保数据的唯一性。
  3. 主键索引:一种特殊的唯一索引,不允许有空值。一个表只能有一个主键索引。
  4. 全文索引:用于对文本数据进行全文搜索。适用于大文本字段的模糊查询。

按照物理实现划分

  1. 聚集索引:表中行的物理顺序与键值的逻辑顺序相同。一个表只能有一个聚集索引。
  2. 非聚集索引:表中行的物理顺序与键值的逻辑顺序可以不同。一个表可以有多个非聚集索引。

索引的优点

  • 加速数据检索:索引可以显著提高查询的速度,尤其是在大型表中进行搜索时。
  • 保证数据唯一性:唯一索引可以确保数据库表中每一行数据的唯一性。
  • 加速表之间的连接:在连接操作中,索引可以显著提高连接的速度。
  • 减少排序和分组的时间:在使用ORDER BYGROUP BY子句进行数据检索时,利用索引可以减少排序和分组的时间。

索引的缺点

  • 占用物理空间:索引需要占用额外的存储空间。
  • 降低数据维护速度:当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度。

如何选择索引

  • 频繁查询的字段:对经常出现在WHERE子句中的字段建立索引。
  • 连接操作的字段:对连接操作中使用的字段建立索引。
  • 排序和分组的字段:对ORDER BYGROUP BY子句中的字段建立索引。

如何使用索引

  • 选择合适的索引类型:根据查询需求选择普通索引、唯一索引、聚集索引或非聚集索引。
  • 避免过多的索引:索引数量过多会影响数据的插入、更新和删除操作的性能。
  • 使用覆盖索引:在查询中只选择索引列,避免回表操作。
  • 定期重建索引:对频繁更新的表,定期重建索引以保持索引的效率。

索引失效的场景

索引失效是指在数据库查询过程中,由于某些原因导致索引无法被有效利用,从而使查询性能下降,甚至退化为全表扫描的情况。以下是一些常见的索引失效场景:

  1. 使用函数或表达式:在查询中对列使用函数、表达式或计算,可能导致索引无法生效。

  2. 使用通配符开头的模糊搜索:如 LIKE '%pattern%' 形式的模糊搜索,索引通常无法用于查找匹配项。避免方法:尽量避免通配符开头,可以考虑使用 'pattern%' 来进行模糊搜索。

  3. 类型隐式转换:参数类型与字段类型不匹配,导致类型发生了隐式转换,索引失效。

  4. 使用OR操作:查询条件使用OR关键字,如果其中一个字段没有创建索引,则可能导致整个查询语句索引失效。

  5. 违背最左匹配原则:在使用组合索引时,不满足最左匹配原则等。

  6. 两列做比较:在查询条件中对两个索引列进行比较操作,可能导致索引失效。

  7. 不等于比较:使用不等(<> 或 !=)进行比较时,可能导致索引失效。

  8. 其他:数据库优化器的其他优化策略,比如优化器认为在某些情况下,全表扫描比走索引快,则它就会放弃索引。

        了解这些索引失效的场景和避免方法,可以帮助我们更好地设计和维护数据库索引,从而提高数据库查询性能。

http://www.lryc.cn/news/463356.html

相关文章:

  • 基于JAVA+SpringBoot+Vue的旅游管理系统
  • STM32_实验3_控制RGB灯
  • RISC-V笔记——Pipeline依赖
  • 构建后端为etcd的CoreDNS的容器集群(六)、编写自动维护域名记录的代码脚本
  • Leetcode 剑指 Offer II 098.不同路径
  • LabVIEW智能螺杆空压机测试系统
  • 在 Ubuntu 22.04 上安装 PHP 8.2
  • Java生死簿管理小系统(简单实现)
  • 【VoceChat】一个即时聊天(IM)软件,又是一个可以嵌入任何网页聊天系统
  • 【LeetCode】动态规划—96. 不同的二叉搜索树(附完整Python/C++代码)
  • Nginx UI 一个可以管理Nginx的图形化界面工具
  • Vue向上滚动加载数据时防止内容闪动
  • 基于QT、ARM的智能停车管理系统+高分项目+源码
  • 1.6,unity动画Animator屏蔽某个部位,动画组合
  • 发动机冷却系统排空气
  • 三周精通FastAPI:1 第一步入门
  • RestTemplate基本使用之HTTP实现GET请求和POST请求
  • 2024-10-18 问AI: [AI面试题] 神经网络有哪些不同类型?
  • 【开源免费】基于SpringBoot+Vue.JS课程作业管理系统(JAVA毕业设计)
  • jmeter中对于有中文内容的csv文件怎么保存
  • Leetcode 921 Shortest Path in Binary Matrix
  • 第二十二篇——菲欧几何:相对论的数学基础是什么?
  • 【AI整合包及教程】EchoMimic:开创数字人新时代,让静态图像“活”起来!
  • ArcGIS 最新底图服务地址
  • 【服务器部署】Docker部署小程序
  • 三菱FX PLC设计一个电子钟程序实例
  • 妇女、商业与法律(WBL)(1971-2023年)
  • python 卸载、安装、virtualenv
  • ubuntu24.0离线安装Ollama和纯cpu版本以及对接Spring AI
  • 机器学习核心:监督学习与无监督学习