当前位置: 首页 > news >正文

b 树和 b+树的理解

项目场景:

图灵奖获得者(Niklaus Wirth )说过: 程序 = 数据结构 + 算法, 也就说我们无时无刻 都在和数据结构打交道。 只是作为 Java 开发,由于技术体系的成熟度较高,使得大部分人认为:程序应该等于 框 架 + SQL ?


问题分析与描述:

从二方面方面来思考:

  • 了解二叉树、AVL 树、B 树的概念
  • B 树和 B+树的应用
  1. B 树是一种多路平衡查找树,为了更形象的理解,如下图所示。

        二叉树,每个节点支持两个分支的树结构,相比于单向链表,多了一个分支。

        二叉查找树,在二叉树的基础上增加了一个规则,左子树的所有节点的值都小于它的根 节点,右子树的所有子节点都大于它的根节点。如下图所示。

        

        二叉查找树会出现斜树问题,导致时间复杂度增加,因此又引入了一种平衡二叉树,它具有二叉查找树的所有特点,同时增加了一个规则:”它的左右两个子树的高度差的绝对值不超过 1“。平衡二叉树会采用左旋、右旋的方式来实现平衡。如下图所示。

        而 B 树是一种多路平衡查找树,它满足平衡二叉树的规则,但是它可以有多个子树,子树的数量取决于关键字的数量,比如这个图中根节点有两个关键字 3 和 5, 那么它能够拥有的子路数量=关键字数+1。 如下图所示。 

        因此从这个特征来看,在存储同样数据量的情况下,平衡二叉树的高度要大于 B 树

B+树,其实是在 B 树的基础上做的增强,最大的区别有两个:

         a. B 树的数据存储在每个节点上,而 B+树中的数据是存储在叶子节点,并且通过链表的方               式把叶子节点中的数据进行连接。

        b. B+树的子路数量等于关键字数

---------------------------------------------------------------------------------------------------------------------------------

如下图所示,这个是 B 树的存储结构,从 B 树上可以看到每个节点会存储数据。

 如下图所示,这个是 B+树,B+树的所有数据是存储在叶子节点,并且叶子节点的数据是用双向链表关联的

        2. B 树和 B+树,一般都是应用在文件系统和数据库系统中,用来减少磁盘 IO 带来的性能损耗

         以 Mysql 中的 InnoDB 为例,当我们通过 select 语句去查询一条数据时,InnoDB 需要从磁盘上去读取数据,这个过程会涉及到磁盘 IO 以及磁盘的随机 IO(如图所示) 我们知道磁盘 IO 的性能是特别低的,特别是随机磁盘 IO。 因为,磁盘 IO 的工作原理是,首先系统会把数据逻辑地址传给磁盘,磁盘控制电路按照寻址逻辑把逻辑地址翻译成物理地址,也就是确定要读取的数据在哪个磁道,哪个扇区。

        为了读取这个扇区的数据,需要把磁头放在这个扇区的上面,为了实现这一个点,磁盘 会不断旋转,把目标扇区旋转到磁头下面,使得磁头找到对应的磁道,这里涉及到寻道事件以及旋转时间。

 

        很明显,磁盘 IO 这个过程的性能开销是非常大的,特别是查询的数据量比较多的情况下。 所以在 InnoDB 中,干脆对存储在磁盘块上的数据建立一个索引,然后把索引数据以及 索引列对应的磁盘地址,以 B+树的方式来存储。 如图所示,当我们需要查询目标数据的时候,根据索引从 B+树中查找目标数据即可, 由于 B+树分路较多,所以只需要较少次数的磁盘 IO 就能查找到。

 

        3. 为什么用 B 树或者 B+树来做索引结构?原因是 AVL 树的高度要比 B 树的高度要高,而高度就意味着磁盘 IO 的数量。所以为了减少磁盘 IO 的次数,文件系统或者数据库才会采用 B 树或者 B+树。

结尾

        数据结构在实际开发中非常常见,比如数组、链表、双向链表、红黑树、跳跃表、B 树、 B+树、队列等。 数据结构是编程中最重要的基本功之一。

        学了顺序表和链表,我们就能知道查询操作比较多的场景中应该用顺序表,修改操作比 较多的场景应该使用链表。

        学了队列之后,就知道对于 FIFO 的场景中,应该使用队列。

        学了树的结构后,会发现原来查找类的场景,还可以更进一步提升查询性能。

基本功决定大家在技术这个岗位上能够走到的高度。

http://www.lryc.cn/news/107851.html

相关文章:

  • 正则表达式 —— Awk
  • 国芯新作 | 四核Cortex-A53@1.4GHz,仅168元起?含税?哇!!!
  • 【MyBatis】 框架原理
  • 三、线性工作流
  • 2023华数杯数学建模A题思路 - 隔热材料的结构优化控制研究
  • Zabbix分布式监控Web监控
  • PHP从入门到精通—PHP开发入门-PHP概述、PHP开发环境搭建、PHP开发环境搭建、第一个PHP程序、PHP开发流程
  • 【LeetCode-中等】722. 删除注释
  • rust里如何判断字符串是否相等呢?
  • python基本知识学习
  • vue3和typescript_组件
  • Qt+联想电脑管家
  • 论文阅读-BotPercent: Estimating Twitter Bot Populations from Groups to Crowds
  • 用于永磁同步电机驱动器的自适应SDRE非线性无传感器速度控制(MatlabSimulink实现)
  • Spring Cloud+Spring Boot+Mybatis+uniapp+前后端分离实现知识付费平台免费搭建 qt
  • 删除注释(力扣)
  • 阿里云AK创建
  • OC与Swift的相互调用
  • 某银行软件测试笔试题
  • SpringMVC概述、SpringMVC的工作流程、创建SpringMVC的项目
  • 一文说清楚支付架构
  • 【Golang 接口自动化00】为什么要用Golang做自动化?
  • Android 架构模式如何选择
  • 深入了解 LoRaWAN® B 类设备
  • KK集团再闯港交所:引领潮流零售市场,2023年一季度业绩增势显著
  • Vue中的组件渲染
  • docker 保存和载入镜像
  • Java框架(九)--Spring Boot入门(1)
  • 2023年第四届“华数杯”数学建模思路 - 案例:随机森林
  • Redis中缓存穿透、击穿、雪崩以及解决方案