当前位置: 首页 > news >正文

【MySQL数据库】| 索引以及背后的数据结构

🎗️ 主页:小夜时雨
🎗️ 专栏:MySQL数据库
🎗️ 如何优雅的活着,是我找寻的方向
优雅

目录

    • 1. 基本知识
    • 2. 索引背后的数据结构
      • 总结

1. 基本知识

  1. 概念

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中一列或者多列创建索引,并指定索引的类型,各类的索引有各自的数据结构来实现。

索引存在的意义就是就是为了加快查询速度!!!(因为实际开发中,查询场景用的多)。
但是也付出了一定的代价:

  1. 需要付出额外的空间来保存索引的数据。
  2. 索引可能会拖慢新增,删除和修改的速度。
  1. 作用
  • 数据库中的表,数据,索引之间的关系,类似于书架上的图书,书籍内容和目录的关系。
  • 索引所起的作用类似于数据目录,可以快速定位,检索数据。
  • 索引对于提高数据库的性能有很大的帮助。
  1. 使用场景

要考虑对数据库表的某列或者几列创建索引,需要考虑以下几点:

  • 数据量较大,且经常要对这些列进行条件查询
  • 插入和修改操作较少
  • 索引会占用额外的磁盘空间

那么也就引申出什么时候不要用索引?

  1. 经常增删改的列不要建立索引
  2. 有大量重复的列不建立索引

2. 索引背后的数据结构

索引背后使用的是 B+ 树。

1. 为什么不使用 二叉搜索树或者哈希表来存储索引数据?

  • 对于二叉搜索树:二叉搜索树的特点是,每个非叶子节点都有两个孩子节点,
    如果元素的个数多了,那么树的高度就会很高,自根节点向下搜索需要访问的叶子结点也会非常多,这就大大降低了查询的效率。树的高度相当于是比较次数,对于数据库来说就是 IO 的访问次数。

  • 对于哈希表: 虽然查询的快,但是哈希表是 key-value 结构的,需要知道 key 是多少,通过哈希函数来计算到下标,进而查找到数据,但是模糊查询的时候,key 值无法确定,也就查询不到数据了,即是不支持范围查询和模糊查询。

2. 索引结构为什么不使用 B 树(或者B- 树) ?

B 树可以认为是一个N叉搜索树 ,结构如下:
在这里插入图片描述

B 树的特点:

每个节点都可以存储多个数据,这些多个数据就划分出了一定的区间,在搜索的时候就不用访问那么多的叶子节点,而是直接在细分的区间去查找,提高了效率。

MySQL索引结构–B+ 树

结构如下:
在这里插入图片描述
B+树的特点:

  1. 一个节点可以存储 N 个key,N 个key又划分出 N 个区间 (不是 N+1 个区间,看图可知)
  2. 整个树的数据都是在 叶子节点上的,所有非叶子节点上的数据都会在叶子节点中出现(同时也是叶子结点的最大值)。也就是每个节点中的 key 值,都会在子结点中出现,同时该key也是子节点的最大值。
  3. B+ 树的叶子节点是首尾相连的,类似于链表结构的。
  4. 由于叶子节点保存完整的数据,只在叶子节点这里存储每一行的数据,而非叶子节点只保存key值即可

B+ 树的优势:

  • 一个节点中保存更多的key值,所以最终树的高度是相对矮的,也就是查询的时候减少了 IO 的访问次数。(这里 IO 特值硬盘的访问)
  • 所有的查询都会落在叶子节点,也就是查询任何一个数据,访问 IO 的次数是一样的,也就意味着查询更加稳定(稳定可以对执行效率有一个判断)。
  • B+ 树的叶子节点类似于链表结构,方便进行范围查询。
  • 由于所有数据都是在叶子节点上,非叶子节点只存储key值,所以非叶子节点占用的空间是比较小的,这些叶子节点可能就是在内存中缓存,有进一步减少了 IO 的访问次数。

总结

  • B+树对于哈希表来说,可以处理模糊匹配的场景;
  • B+树对于二叉搜索树来说,深度更低,查找效率更高;
  • B+树对于B树来说,
    • B树只适合随机检索,而B+树同时支持随机检索和顺序检索;
    • 单一节点可以储存更多的数据,降低查询的IO次数;
    • 所有的查询都需要查找到叶子结点,使得查询性能更稳定;
    • 兄弟节点之间相连形成有序链表,便于范围内查找,增删效率也更高;

🎗️🎗️🎗️ 好啦,到这里有关 数据库索引 的分享就没了,如果感觉做的还不错的话可以点个赞,关注一下,你的支持就是我继续下去的动力,蟹蟹大家了,我们下期再见,拜了个拜~ ☆*: .。. o(≧▽≦)o .。.:*☆

http://www.lryc.cn/news/224291.html

相关文章:

  • 家用电脑做服务器,本地服务器搭建,公网IP申请,路由器改桥接模式,拨号上网
  • 原神游戏干货分享:探索璃月的宝箱秘密,提高游戏资源获取效率!
  • idea 2023 设置启动参数、单元测试启动参数
  • RSA加密算法(后端)
  • 挑战100天 AI In LeetCode Day08(热题+面试经典150题)
  • 地铁机电设备健康管理现状及改善方法
  • 安卓NDK开发
  • 高性能网络编程 - 解读5种I/O模型
  • 复盘一个诡异的Bug
  • 【uniapp】通用列表封装组件
  • 17 Linux 中断
  • 微信小程序真机调试连接状态一直在正常和未链接之间反复横跳?
  • 最新Next 14快速上手基础部分
  • 【uniapp/uview】Collapse 折叠面板更改右侧小箭头图标
  • 企业如何落地搭建商业智能BI系统
  • RedisTemplate连接密码设置教程
  • 基于SSM的二手车交易网站的设计与实现
  • 温故知新:探究Android UI 绘制刷新流程
  • 设计模式-命令模式(Command)
  • linux批量解压zip
  • HBase导出建表语句
  • Linux环境配置(云服务器)
  • 【性能测试】Linux下Docker安装与docker-compose管理容器(超细整理)
  • 陪玩2.0升级版源码/价值18500元的最新商业版游戏陪玩语音聊天系统源码
  • 读程序员的制胜技笔记08_死磕优化(上)
  • 【gltf-pipeline】安装gltf-pipeline 进行文件格式转换
  • Android OpenGL ES踩坑记录
  • Vue3 项目完整配置
  • 二十三种设计模式全面解析-从线程安全到创新应用:探索享元模式的进阶之路
  • Qt之qobject_cast使用