当前位置: 首页 > news >正文

【数据结构】败者树的建树与比较过程

文章目录

    • 前置知识
      • 归并段
    • 建树过程
    • 比较过程
    • 疑问
      • 为什么比较次数减少了?
      • 如果某个归并段的元素一直获胜,没有元素了怎么办?
        • 处理方法 1
        • 处理方法 2

前置知识

归并段

  • 外部排序算法通常用于处理大规模数据,其中数据量远超过计算机内存的容量。由于内存无法一次性容纳全部数据,因此需要将数据划分为较小的片段进行排序,在排序过程中将这些片段合并成一个有序的序列
  • 这些归并段内部是有序的,各个归并段之间无序
  • 如图,有 3 个归并段,内部升序
    在这里插入图片描述

建树过程

  • 假设有 5 个节点,给这些节点编号
    在这里插入图片描述

  • 17 是 0 号节点,5 是 1 号节点,…,15 是 4 号节点

  • 为每个节点创建一个根节点,根节点的值是其编号,叶子节点是值
    在这里插入图片描述

  • 从子树中任意挑选两个子树的根节点进行比较,比较对应的值,假设比较规则是:值小的胜出
    本例中,初始有 5 棵子树

  • 比较顺序是任意的,假设根节点为 0 和 1 对应子树进行比较,取出根节点对应的值,5 < 17,5 胜出

    • 除去两棵子树的根节点后,胜者的根节点作为两棵子树的爷节点,败者的根节点作为两棵子树的父节点
    • 即 0 作为父节点,1 作为爷节点

    在这里插入图片描述

  • 比较根节点为 3 和 4 对应子树,取出根节点对应的值,15 < 29,15 胜出
    3 作为父节点,4 作为爷节点
    在这里插入图片描述

  • 比较根节点为 1 和 2 对应的子树,5 < 10,5 胜出
    1 作为爷节点,2 作为父节点
    在这里插入图片描述

  • 比较根节点为 1 和 4 对应的子树,5 < 15,5 胜出
    1 作为爷节点,4 作为 父节点
    在这里插入图片描述

  • 可以看出,根节点是 1,其对应的值是 5,也就是{17, 5, 10, 29, 15} 中的最小值,共比较 4 次
    败者树构建完成

比较过程

  • 将根节点对应的值进行输出,假设编号 1 所在的归并段还有元素需要比较,是 44

  • 败者树需要调整,将根节点重新和编号 1 对应的值进行组合
    在这里插入图片描述

  • 根节点为 0 和 1 的子树进行比较,17 < 44,17 胜出
    0 作为爷节点,1 作为父节点
    在这里插入图片描述

  • 根节点为 0 和 2 的子树进行比较,10 < 17,10 胜出

    2 作为爷节点,0 作为父节点在这里插入图片描述

  • 根节点为 2 和 4 的子树进行比较,10 < 15,10 胜出

    2 作为爷节点,4 作为父节点

    在这里插入图片描述

  • 可以看出,根节点是 2,其对应的值是 10,也就是{17, 44, 10, 29, 15} 中的最小值,共比较 3 次,比建树时找到最小值所需的比较次数(5次)少

疑问

为什么比较次数减少了?

  • 在刚才的例子中,44 没有和 4 的右子树进行比较,这是为什么呢?
    在这里插入图片描述
    • 败者树中,两棵子树的合并规则是:胜者根节点做爷节点,败者做父节点
      因此,编号 3 是败者,编号 4 是胜者

    • 新节点 x 只需要和胜者 y 比较即可

      • 若 x < y,那么 x 可以做根节点,而 y 做父节点
      • 反之 y 做根节点,而 x 做父节点
    • 换句话说,在设定的比较规则中(值小的获胜),我们只关心获胜者(谁是最小的),而不关心节点比哪些节点大

      • 有 2 个集合 A,B,我们想找到两个集合的最小值
        A 集合的最小值是 x
        B 集合的最小值是 y

        显然,要选出最小值,只要比较 x 和 y 即可,若 x < y,那么 x 就是 A 和 B 中最小的,y 比 A 中的哪些元素小,我们并不关心在这里插入图片描述

如果某个归并段的元素一直获胜,没有元素了怎么办?

处理方法 1
  • 记录归并段的元素个数,若某个归并段没有元素,则在输出其根节点对应的值后,移除这课子树

  • 编号 1 对应的归并段没有元素了,那么输出 5,并移除 5 对应的子树,移除后的败者树被破坏了
    在这里插入图片描述

  • 0 和 2 需要重新比较
    在这里插入图片描述

  • 2 和 4 重新比较
    在这里插入图片描述

  • 败者树又构建好了(ヾ(•ω•`)o)
    在这里插入图片描述

处理方法 2
  • 可以填充一个“最大值”,保证所有元素都比最大值小,那么这个最大值就不会在接下来的比较中胜出

  • 1 对应的 5 输出,而 1 合并的是 2 和 4

在这里插入图片描述

  • 假设 999 是最大的值了,类似方法 1,调整一下败者树的结构

在这里插入图片描述
2 对应的 10 是 {17, 999, 10, 29, 15} 中的最小值

http://www.lryc.cn/news/218855.html

相关文章:

  • GlobalMapper---dem生成均匀分布的网格,或者均匀分布的点高程点
  • k8s系列文章一:安装指南
  • Pod 进阶
  • Proteus仿真--12864LCD显示计算器键盘按键实验(仿真文件+程序)
  • pam_radius库的使用
  • qt6:无法使用setFontColor
  • 竞赛 深度学习疫情社交安全距离检测算法 - python opencv cnn
  • 无声的世界,精神科用药并结合临床的一些分析及笔记(十)
  • 构建强大的Web应用之Django详解
  • Linux 之搭建 arm 的 qemu 模拟器
  • uinapp微信小程序隐私政策授权
  • 使用Java工作流简单介绍
  • 数字媒体技术基础之:ICC 配置文件
  • 解析SD-WAN组网方式及应用场景,全面了解典型案例
  • 中小学智慧校园电子班牌管理系统源码
  • 日常踩坑-[sass]Error: Expected newline
  • UI设计感蓝色商务数据后台网站模板源码
  • 二、计算机组成原理与体系结构
  • MySQL-sql的优化
  • 一致性哈希在分库分表的应用
  • PostCSS通过px2rem插件和lib-flexible将px单位转换为rem(root em)单位实现大屏适配
  • 什么是缓冲区溢出?
  • 论文浅尝 | ChatKBQA:基于微调大语言模型的知识图谱问答框架
  • 软件测试的目的---防范项目风险
  • 自己动手写编译器:创建由 C 语言编译而成的语法解析器
  • 接口设计-增删改查
  • 持续持续集成部署-k8s-配置与存储-配置管理:Secret 的应用
  • ZYNQ7020开发(一):开发环境搭建
  • Spring Boot插件化开发概念原理及实现
  • Ps:PSDT 模板文件