当前位置: 首页 > news >正文

数据结构——B-树、B+树、B*树

一、B-树

1. B-树概念

        B树是一种适合外查找的、平衡的多叉树。一棵m阶(m>2)的B树,是一棵平衡的M路平衡搜索树,它可以是空树或满足以下性质:

        (1)根节点至少有两个孩子。

        (2)每个分支节点都包含k-1个关键字和k个孩子,其中ceil(m/2)<= k <= m。(ceil表示向上取整)

        (3)每个叶子节点都包含k-1个关键字,其中ceil(m/2)<= k <= m。

        (4)所有叶子节点都在同一层。

        (5)每个节点中的关键字从小到大排列,节点中k-1个元素正好是k个孩子包含的元素的值域划分。

        (6)每个节点的结构为:(n, A0, K1, A1, K2, A2……, Kn, An),其中Ki(1<=i<=n)为关键字,且ki<ki + 1(1<=i<=n)。Ai(0<=i<=n)为指向子树根节点的指针,且Ai所指子树所有节点中的关键字均小于Ki+1。n为节点中关键字的个数,满足ceil(m/2)-1 <=n <= m-1。

2. B树的插入

        采用m为3的一棵三叉B树的插入过程进行演示。根据B树性质可知,m为3,则每个节点最多有三个孩子(m-1个),每个节点包含k-1个关键字,2<=k<=3。注意:插入只能插入到叶子节点

(1)首先插入两个值20,30

(2)插入第三个值25,由于每个节点最多有2个关键字,所以此时会进行分裂来维持B树平衡。

2.1 B树分裂规则

        创建一个兄弟节点,拷贝当前节点内右半区间的数据到兄弟节点中,保留当前节点中左半区间的数据,将该节点内的中位数提到父节点中(若没有父节点,则创建新的父节点)。

(3)插入35

(4) 插入40

        此时根节点的右侧孩子内数据超过2个,则按照B树分裂规则分裂后如下:

 (5)插入33

(6)插入34

        此时根节点的中间孩子内数据超过2两个,进行分裂,当提取33到父节点后,根节点内数据也超过了2个,则根节点也会进行分裂,此时没有父节点,则会创建新的父节点,结构如下:

三、B+树

1. B+树概念

        B+树是B树的变形,它是在B树基础上进行优化的多路平衡搜索树,B+树的规则和B树基本类似,但在其基础上进行了以下优化:

        (1)分支节点的子树指针与关键字个数相同;

        (2)分支节点的子树指针p[i]指向关键字值大小在[k[i], k[i+1]]之间;

        (3)所有叶子节点增加一个链接指针链接在一起;

        (4)所有关键字及其映射数据都在叶子节点出现。

优点:

(1)简化了B树孩子币关键字多一个的规则,由多一个变成相等。

(2)所有值都在叶子节点中,且叶子节点通过指针链接起来,方便遍历。

2. B+树的插入

        B+树的插入过程与B树基本类似,区别在于:

        (1)第一次插入两层节点,一层做分支,一层做根;

        (2)B+树在分裂时,是将左半部分的数据保留,右半部分的数据放入新建兄弟节点中,并将新建节点中的最小值更新到父节点中。

三、B*树

1. B*树概念

        B*树又是B+树的变形,做了以下改动:

        (1)在B+树的非根和非叶子节点再增加指向兄弟节点的指针。

        (2)节点在分裂时,保证每个节点中值的数量至少为2/3 * M,最多为M个,也就是从1/2提高到了2/3,提高空间利用率。

 2. B*树的插入

        B*树的插入与B+树基本类似,区别主要在于分裂规则,B*树的分裂规则:

        如果它的下一个兄弟节点未满,则将一部分数据移到兄弟节点中,再在原节点中插入关键字,最后修改父节点中兄弟节点的关键字(因为兄弟节点的关键字范围发生了变化);

        如果兄弟节点也满了,则在原节点与兄弟节点之间添加新节点,并各复制1/3的数据到新节点中,最后在父节点中添加新节点的指针。

四、B树系列的优缺点

1. 优点

        (1)高效的查找操作:B树系列的数据结构通过将数据分布在多层节点上,使用索引快速导航到目标元素所在的叶子节点,从而实现了高效的查找操作。其时间复杂度通常为O(log_{M}^{N})

        (2)适应大规模数据集:B树系列的数据结构能够充分利用磁盘块的大小,减少磁盘I/O操作的次数,提高存储和访问效率。它们被广泛应用于数据库索引、文件系统等需要处理大规模数据集的场景。

        (3)自平衡特性:B树系列的数据结构通过节点的分裂和合并来自动保持树的平衡,保证了各个节点的高度相对较小,从而维持了高效的操作性能。

        (4)支持范围查询:由于B树系列的数据结构中数据是按照键的大小顺序进行排序,因此可以很方便地进行范围查询操作。

2. 缺点

        (1)空间利用率低,消耗高。

        (2)插入删除数据、分裂合并节点,都必然存在数据挪动。

        (3)虽然B树系列的高度更低,但是在内存中和哈希、平衡搜索树的查找效率处于同一量级。

http://www.lryc.cn/news/131826.html

相关文章:

  • 2023国赛数学建模思路 - 案例:FPTree-频繁模式树算法
  • GPT系列总结
  • 【福建事业单位-综合基础知识】05民法典
  • 微服务篇
  • C++ 的关键字(保留字)完整介绍
  • C#小轮子:MiniExcel,快速操作Excel
  • Ribbon负载均衡
  • LeetCode--HOT100题(33)
  • 【docker练习】
  • 韦东山-电子量产工具项目:业务系统
  • React(6)
  • RabbitMq-2安装与配置
  • 论文笔记:Continuous Trajectory Generation Based on Two-Stage GAN
  • redis实战-缓存数据解决缓存与数据库数据一致性
  • 【排序】选择排序
  • 深入浅出Pytorch函数——torch.nn.init.trunc_normal_
  • 探索高级UI、源码解析与性能优化,了解开源框架及Flutter,助力Java和Kotlin筑基,揭秘NDK的魅力!
  • 国外服务器怎么有效降低延迟
  • AI百度文心一言大语言模型接入使用(中国版ChatGPT)
  • vue 安装并配置vuex
  • 有一种新型病毒在 3Ds Max 环境中传播,如何避免?
  • 基于Java/springboot铁路物流数据平台的设计与实现
  • 比较杂的html元素
  • Docker基本管理
  • .NET Core6.0使用NPOI导入导出Excel
  • 用API接口获取数据的好处有哪些,电商小白看过来!
  • 使用struct解析通达信本地Lday日线数据
  • 浅谈早期基于模板匹配的OCR的原理
  • 第6章 分布式文件存储
  • Spring(四):Spring Boot 的创建和使用