当前位置: 首页 > news >正文

数据结构初阶(7)树 二叉树

逻辑结构的分类

(1)线性结构

  • 线性表

(2)非线性结构

  • 树结构
  • 图结构
  • 集合结构

1. 树概念及结构

1.1 树的概念

树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。

把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的

  • 有一个特殊的结点,称为根结点,根节点没有前驱结点。
  • 除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继。
  • 因此,树是递归定义的。

注意:树形结构中,子树之间不能有交集,否则就不是树形结构(图)

  • 子树是不相交的——树里面没有环(图)
  • 除了根结点外,每个结点有且仅有一个父结点;
  • 一棵N个结点的树有N-1条边;

1.2 树的相关概念

树的相关概念(树中的概念都是类比“树”和“人类亲缘关系”,来定义的)

  • 节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A结点的度为6。
  • 树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6

  • 叶节点(终端节点)度为0的节点称为叶节点; 如上图:B、C、H、I...等节点。
  • 分支节点(非终端节点)度不为0的节点; 如上图:D、E、F、G...等节点为分支节点

  • 双亲节点(父节点)若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
  • 孩子节点(子节点):一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点

  • (亲)兄弟节点具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
  • 堂兄弟节点双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点

  • 节点的层次从根开始定义起,根为第1层,根的子节点为第2层,以此类推
  • 树的高度(深度):树中节点的最大层次; 如上图:树的高度为4

  • 节点的祖先从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
  • 子孙以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
  • 森林由m(m>0)棵互不相交的树的集合称为森林;(并查集)

(子树之间不能称森林)

一颗树有两种结点构成:分支结点、叶子结点。

根节点的层次——有争议

  • 根节点的层次为0(空树的高度为-1,比较奇怪)
  • 根节点的层次为1(建议

数组的下标从0开始,根本原因在于数组的访问a[0]的本质是指针解引用*(a+0)。

树的拆分 = 根 + n棵子树(=根 + m棵子树(=根+……))(递归思维)

1.3 树的表示

树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了。

既要保存值域,也要保存结点和结点之间的关系

1.3.0 孩子表示法

由于树的孩子结点数目是不确定的,就不能简单地像单链表一样一个结点使用一个指针链向下一个结点。


树的最大孩子结点数目——树的度N,是确定的,那每个结点就给N个指针。

但是只有度最大的结点会使用到全部6个数组空间,其他度很小的节点用这个结构就会产生很大的空间浪费。(二叉树的链式存储,是这种方式——二叉树最多两个孩子)



实际中树有很多种表示方式如:

双亲表示法孩子表示法孩子-双亲表示法孩子-兄弟表示法等。

我们这里就简单的了解其中最常用的 孩子-兄弟表示法 (针对任意树)

(二叉树最常用孩子表示法,记录该结点所有的子树地址)

1.3.1 孩子-兄弟表示法

树的节点的结构

typedef int DataType;
struct Node
{struct Node* first_Child;          // 第一个孩子结点struct Node* next_Brother;         // 指向其下一个(亲)兄弟结点DataType _data;                    // 结点中的数据域
};

1.3.2 双亲表示法(只能往上找父亲)

  • 物理结构:数组(内存中如何存储)
  • 逻辑结构:森林(想象出来的)

除了节点的值之外,只去存自己的双亲(父节点)。

  1. 存父节点的指针(地址)——链式存储
  2. 存父节点的下标——顺序存储

结果:只能往回找祖宗不能往下找孩子。

并查集就是这样设计的

好处:可以用一个存储结构(链表、顺序表)表示一个森林

  1. 怎么知道是几棵树?→看根的个数(根下标-1、父地址NULL)
  2. 怎么知道属于哪棵树?→一步一步往回找祖宗,看最后根下标,一样就属于同一棵树。

应用:判断两个元素是否属于同一个朋友圈。

1.3.3 孩子表示法(只能往下找孩子)

二叉树就是使用的这种表示法。

1.4 树在实际中的运用(表示文件系统的目录树结构)

数据结构的类型

  • 存储型:用于存储数据。
  • 表示型:表示某种结构(同时也是在存储数据)。(树、图)

Windows的文件系统可以认为是一个森林。

C盘和D盘两个根目录可以认为是两个根,用的就是左孩子右兄弟表示法

新建文件夹相当于新建一个兄弟。

平时画的思维导图也可以理解为一种树形结构。

2. 二叉树概念及结构

数据结构的核心应用还是存储数据,用树来存储数据没有多大的好处,除非像上面那种一个结点下面有多个分支的场景。

更多的时候,由很多数据需要存储,还是会选择:顺序表、链表。

树形结构比较复杂,实践当中用得并不多。

树这个部分真正用得多的是二叉树——最多有两个孩子的树。

(加了限制的树,才方便控制,才能广泛应用)

2.1 概念

一棵二叉树是结点的一个有限集合,该集合:

  1. 或者为空
  2. 由一个根节点加上两棵别称为左子树右子树的二叉树组成

由于二叉树一个节点最多只有两个孩子,于是二叉树这里便把孩子作了严格的区分:

——左孩子、右孩子。

从上图可以看出:

  1. 二叉树不存在度大于2的结点
  2. 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树

 注意

对于任意的二叉树都是由以下几种情况复合而成的:


那二叉树用来存储数据有什么意义呢?

没什么意义,更适用的是顺序表、链表,没有必要用树来存。

二叉树单纯存储数据是没啥价值——不如顺序表/链表

树→二叉树→更加限制的二叉树,才是实践中有比较多的应用。

以前的顺序表、链表主要用于存储数据,栈和队列在存储数据上加了一些要求。

这里学的数据结构除了进行数据存储,还要实现一些特定的功能。

应用①——搜索二叉树


例子:找61一定在48右边。

→有没有可能在48左边呢?比如25的右边→答:不可能——因为当初61在插入的时候就不可能往48左边走,更不可能到达25右边的位置

→所以说二叉搜索树的特点:左子树的右孩子一定比父亲大、比爷爷小

二叉搜索树(搜索二叉树)

要求

  • 左子树 < 根 < 右子树(这也是插入数据、查找数据的规则)

应用

  • 存储数据
  • 查找数据

优势

  • 最多查找高度次

缺陷

  • 按自然顺序插入→搜索二叉树退化成链表——查找效率O(N)

(单链表只有一个指针,二叉树是两个指针,还有一个指向NULL)

AVL树、红黑树(搜索二叉树再扩展的两种树)

……

多叉搜索树(压缩高度)——M阶B树(数据库引擎)

……

二叉树线索化:方便遍历,实践中没什么用。

哈夫曼树(二叉树):主要用于文件压缩算法,实际当中用得比较少。

2.2 现实中的二叉树

2.3 特殊的二叉树

  1. 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是(2^k)-1,则它就是满二叉树。(前n-1层每个结点的度都是2,叶子结点都在最后一层)
  2. 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点,都与深度为K的满二叉树中编号从1至n的结点一一对应时,称之为完全二叉树。

(前n-1层都是满的,最后一层不一定满,但是要求从左到右连续)

满二叉树是一种特殊的完全二叉树

2.4 二叉树的性质

1. 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点.

2. 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是(2^h)-1

3. 对任何一棵二叉树,如果度为0其叶结点个数为n0,度为2的分支结点个数为n2,
则有 n0 = n2 +1。

4. 若规定根节点的层数为1,具有n个结点的满二叉树的深度h = log2(n+1)

(ps: log2(n+1)是log以2为底,n+1为对数)

5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则:

① 序号为i的结点的双亲结点

  • 若 i=0,i为根节点编号,无双亲节点。
  • 若 i > 0,i位置节点的双亲序号:(i-1)/2

② 序号为i的结点的孩子结点

  • 若2i+1<n,左孩子序号:2i+1;
  • 若2i+1>=n,则无左孩子;
  • 若2i+2<n,右孩子序号:2i+2;
  • 若2i+2>=n,则无右孩子;

性质选择题

2.5 二叉树的存储结构

二叉树一般可以使用两种结构存储:顺序结构链式结构

2.5.1 顺序存储

顺序结构存储:使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。

而现实中使用中只有堆才会使用数组来存储,关于堆后面的章节会专门讲解。

二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树

不存储父亲的下标。

而是

  • 根据二叉树的结构,一层一层地,从左到右,依次存储;
  • 留出对应的完全二叉树的缺失的位置的空间。

这样父亲的下标和孩子的下标就有了某种对应关系:

左孩子都是奇数位,右孩子都是偶数位(减1除2和减2除2一样)

支持:父亲找孩子、孩子找父亲。


给到一个顺序存储的二叉树,还原树形结构:

先取一个(第一层)→再取两个(第2层)→再取4个(第3层)→再……

存的时候一层一层往里存,取的时候也一层一层往外取。


结论

数组存储只适合完全二叉树和满二叉树,用于存储普通二叉树,空间浪费大。

普通二叉树只适合链式存储。

2.5.2 链式存储

链式存储结构:是指用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。

通常的方法是:每个结点由三个域组成——数据域、左右指针域。

——左右指针分别用来给出:该结点左孩子和右孩子所在的链结点的存储地址 。

链式结构又分为:二叉链(只能往下找)三叉链(可以往下、上找)

当前我们学习中一般都是二叉链,后面学到高阶数据结构如红黑树等会用到三叉链。

typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{struct BinTreeNode* _pLeft;     // 指向当前节点左孩子struct BinTreeNode* _pRight;    // 指向当前节点右孩子BTDataType _data;               // 当前节点数据域
}
// 三叉链
struct BinaryTreeNode
{struct BinTreeNode* _pParent;     // 指向当前节点的双亲struct BinTreeNode* _pLeft;       // 指向当前节点左孩子struct BinTreeNode* _pRight;      // 指向当前节点右孩子BTDataType _data;                 // 当前节点数据域
};

总结

http://www.lryc.cn/news/615425.html

相关文章:

  • BGP笔记
  • 机器学习DBSCAN密度聚类
  • 讯飞晓医-讯飞医疗推出的个人AI健康助手
  • 复杂环境下车牌识别准确率↑29%:陌讯动态特征融合算法实战解析
  • 编译技术的两条演化支线:从前端 UI 框架到底层编译器的智能测试
  • Office安装使用?借助Ohook开源工具?【图文详解】微软Office产品
  • 每周算法思考:栈与队列
  • 【数据结构入门】栈和队列
  • 物理AI与人形机器人:从实验室到产业化的关键跨越
  • day15_keep going on
  • [激光原理与应用-202]:光学器件 - 增益晶体 - Nd:YVO₄增益晶体的制造过程与使用过程
  • RecyclerView 缓存机制
  • 202506 电子学会青少年等级考试机器人六级器人理论真题
  • 【自动化运维神器Ansible】playbook自动化部署Nginx案例解析:助力从零构建高效Web服务
  • Kettle ETL 工具存在的问题以及替代方案的探索
  • AWT 事件监听器深入浅出:Action/Mouse/Key/Window 全解析与实战
  • B2.0:对硬件学习的一些个人心得感悟
  • 跨境电商系统开发:ZKmall开源商城的技术选型与代码规范实践
  • Linux 中CentOS Stream 8 - yum -y update 异常报错问题
  • MySQL 主备(Master-Slave)复制 的搭建
  • 每日五个pyecharts可视化图表-line:从入门到精通
  • 基于springboot+vue开发的校园食堂评价系统【源码+sql+可运行】【50809】
  • 计算机系统设计中都有什么任务~计算密集~IO密集~逻辑密集等
  • 通过 Docker 运行 Prometheus 入门
  • 如何在 Excel 中快速求和?【图文详解】Excel求和技巧,Excel求和公式大全,多种方式求和
  • 轻松Linux-5.进程控制
  • drippingblues靶机
  • Easysearch 冷热架构实战
  • 从 AI 到实时视频通道:基于模块化架构的低延迟直播全链路实践
  • Docker容器lnmp平台部署discuz论坛