【C++进阶】---- 二叉搜索树
1.二叉搜索树的概念
⼆叉搜索树⼜称⼆叉排序树,它或者是⼀棵空树,或者是具有以下性质的⼆叉树:
• 若它的左⼦树不为空,则左⼦树上所有结点的值都⼩于等于根结点的值
• 若它的右⼦树不为空,则右⼦树上所有结点的值都⼤于等于根结点的值
• 它的左右⼦树也分别为⼆叉搜索树
• ⼆叉搜索树中可以⽀持插⼊相等的值,也可以不⽀持插⼊相等的值,具体看使⽤场景定义,后续我们学习map/set/multimap/multiset系列容器底层就是⼆叉搜索树,其中map/set不⽀持插⼊相等值,multimap/multiset⽀持插⼊相等值
下图中,左侧的是二叉搜索树,右侧的不是二叉搜索树。
2.二叉搜索树的性能分析
最优情况下,⼆叉搜索树为完全⼆叉树(或者接近完全⼆叉树),其⾼度为:log2 N
最差情况下,⼆叉搜索树退化为单⽀树(或者类似单⽀),其⾼度为:N
所以综合⽽⾔⼆叉搜索树增删查改时间复杂度为:O(N)
那么这样的效率显然是⽆法满⾜我们需求的,我们后续课程需要继续讲解⼆叉搜索树的变形,平衡⼆叉搜索树AVL树和红⿊树,才能适⽤于我们在内存中存储和搜索数据。另外需要说明的是,⼆分查找也可以实现O(log2 N) 级别的查找效率,但是⼆分查找有两⼤缺陷:
- 需要存储在⽀持下标随机访问的结构中,并且有序。
- 插⼊和删除数据效率很低,因为存储在下标随机访问的结构中,插⼊和删除数据⼀般需要挪动数据。这⾥也就体现出了平衡⼆叉搜索树的价值。
3.二叉搜索树的实现
3.1节点和框架
// 结构
template<class K>
struct BSTNode
{K _key;BSTNode<K>* _left;BSTNode<K>* _right;// 默认构造BSTNode(const K& key):_key(key),_left(nullptr),_right(nullptr){}
};template<class K>
class BSTree
{// typedef BSTNode<K> Node;using Node = BSTNode<K>;
private:Node* _root = nullptr;
};
3.2二叉搜索树的插入
插⼊的具体过程如下:
- 树为空,则直接新增结点,赋值给root指针
- 树不空,按⼆叉搜索树性质,插⼊值⽐当前结点⼤往右⾛,插⼊值⽐当前结点⼩往左⾛,找到空位置,插⼊新结点。
- 如果⽀持插⼊相等的值,插⼊值跟当前结点相等的值可以往右⾛,也可以往左⾛,找到空位置,插⼊新结点。(要注意的是要保持逻辑⼀致性,插⼊相等的值不要⼀会往右⾛,⼀会往左⾛)
注意:需提前保存父节点,这样找到插入点后,能够正确的将新节点连接到树中。
// 不允许插入相同的数字bool Insert(const K& key){if (_root == nullptr){_root = new Node(key);return true;}Node* cur = _root;Node* parent = nullptr;// 新节点需要插入到空位置while (cur != nullptr){if (key < cur->_key){parent = cur;cur = cur->_left;}else if (key > cur->_key){parent = cur;cur = cur->_right;}else return false;}// 找到插入位置了cur = new Node(key);if (key < parent->_key) parent->_left = cur;else parent->_right = cur;return true;}
3.3二叉搜索树的查找
- 从根开始⽐较,查找x,x⽐根的值⼤则往右边⾛查找,x⽐根值⼩则往左边⾛查找。
- 最多查找⾼度次,⾛到到空,还没找到,这个值不存在。
- 如果不⽀持插⼊相等的值,找到x即可返回
- 如果⽀持插⼊相等的值,意味着有多个x存在,⼀般要求查找中序的第⼀个x。如下图,查找3,要找到1的右孩⼦的那个3返回
// 不支持插入相同的二叉搜索树
bool Find(const K& key)
{Node* cur = _root;while (cur != nullptr){if (cur->_key == key) return true;else if (cur->_key > key) cur = cur->_left;else cur = cur->_right;}return false;
}
3.4二叉搜索树的删除
⾸先查找元素是否在⼆叉搜索树中,如果不存在,则返回false。
如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N)
- 要删除结点N左右孩⼦均为空
- 要删除的结点N左孩⼦位空,右孩⼦结点不为空
- 要删除的结点N右孩⼦位空,左孩⼦结点不为空
- 要删除的结点N左右孩⼦结点均不为空
对应以上四种情况的解决⽅案: - 把N结点的⽗亲对应孩⼦指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样的)
- 把N结点的⽗亲对应孩⼦指针指向N的右孩⼦,直接删除N结点
- 把N结点的⽗亲对应孩⼦指针指向N的左孩⼦,直接删除N结点
- ⽆法直接删除N结点,因为N的两个孩⼦⽆处安放,只能⽤替换法删除。找N左⼦树的值最⼤结点R(最右结点)或者N右⼦树的值最⼩结点R(最左结点)替代N,因为这两个结点中任意⼀个,放到N的位置,都满⾜⼆叉搜索树的规则。替代N的意思就是N和R的两个结点的值交换,转⽽变成删除R结点,R结点符合情况2或情况3,可以直接删除。
上述四种情况可以归类成两种
- 删除节点只有至多一个孩子(没有孩子或者只有一个孩子)
- 删除节点有两个孩子
下图这种情况就是至多有一个孩子的,我们第一步需要改变要删除的节点的父节点的指向,然后删除该节点,如果要删除的节点有孩子,其父节点指向其孩子,如果要删除的节点没有孩子,其父节点指向空。
(需要特殊考虑删除的是否是根节点)
下图这种情况就是有两个孩子的情况,我们需要先找到替代节点,此节点可以是左子树的最右节点,也可以是右子树的最左节点,下图是以找右子树的最左节点作为替代节点为例。
我们找到替代节点后,需要先将要删除的节点的key值变为替代节点的key值,第二步我们需要改变替代节点的父节点的指向,因为替代节点可能存在孩子,我们需要将其父节点与其子节点之间进行连接。最后我们释放掉替代节点。
(同样需要特殊注意要删除的节点是否是父节点)
bool Erase(const K& key)
{Node* parent = nullptr;Node* cur = _root;while (cur != nullptr){if (cur->_key > key){parent = cur;cur = cur->_left;}else if (cur->_key < key){parent = cur;cur = cur->_right;}else{// 如果删除的是头节点// 没孩子或只有一个孩子可以归类为一种情况// 左为空if (cur->_left == nullptr){// 如果删除的是头节点if (cur == _root) _root = cur->_right;else{if (parent->_left == cur) parent->_left = cur->_right;else parent->_right = cur->_right;}delete cur;}else if(cur->_right==__nullptr){if (cur == _root) _root = cur->_left;else{if (parent->_left == cur) parent->_left = cur->_left;else parent->_right = cur->_left;}delete cur;}// 有两个孩子,需要挑选左子树的最右节点/右子树的最左节点充当该节点else{// 找右子树的最左节点Node* replaceParent = cur;Node* replace = cur->_right;while (replace->_left != nullptr){replaceParent = replace;replace = replace->_left;}// 交换删除节点和替代节点的值cur->_key = replace->_key;//需要考虑这个最左节点有没有右孩子,同时也需要改变其父节点的指向if(replaceParent->_right==replace)// 右子树没有左孩子的情况replaceParent->_right = replace->_right;else replaceParent->_left = replace->_right; // 删除替换节点即可delete replace;}return true;}}// 数据不存在return false;
}
3.4二叉搜索树的中序遍历
因为遍历二叉搜索树需要根节点,而根节点_root是类里的私有成员变量,所以我们可以写一个富辅助函数。
Inorder()是共有的接口函数,用于对外提供中序遍历的功能
_Inorder()是私有的辅助函数,负责实际的递归遍历逻辑
void Inorder(){// 因为遍历需要头节点,但_root是私有的,在外面不能直接调用_Inorder(_root);cout << endl;}
private:void _Inorder(Node* root){if (root == nullptr) return;_Inorder(root->_left);cout << root->_key << " ";_Inorder(root->_right);}Node* _root = nullptr;
3.5二叉搜索树的拷贝构造
因为拷贝构造需要用到根节点_root,又因为_root是私有成员变量,所以我们可以写一个辅助函数来完成拷贝构造
Copy()是私有辅助函数,用于完成二叉搜索树的拷贝
BSTree(const BSTree& t)是共有的接口函数,用于对外提供拷贝功能
(如果不写拷贝构造函数的话,默认是浅拷贝,即两个指针指向同一块地址)
(因为写了拷贝构造,不会生成默认构造函数,会导致创建对象的时候没有合适的默认构造可以使用,C++11支持强制生成)
默认函数=default即可强制生成想要的默认函数
// 因为写了拷贝构造,不会生成默认构造函数,C++11支持强制生成BSTree() = default;// 强制生成默认构造BSTree(const BSTree& t){_root = Copy(t._root);}
private:Node* Copy(Node* root){if (root == nullptr) return nullptr;// Node* newRoot = root;的话是浅拷贝Node* newRoot = new Node(root->_key);newRoot->_left = Copy(root->_left);newRoot->_right = Copy(root->_right);return newRoot;}
3.5二叉搜索树的复制运算符重载
这边我们的形参用的是临时对象,对形参的改变不会影响实参,所以我们可以直接将根节点进行交换,原本的_root给给了tmp,出了这个函数后tmp也会自动销毁
BSTree& operator=(BSTree tmp){swap(_root, tmp._root);return *this;}
3.6二叉搜索树的析构
因为析构需要用到根节点,所以我们使用辅助函数来完成析构。
析构我们采用的是先序后序遍历,先析构左右孩子在析构根节点,保证所有节点都得到析构。
~BSTree(){Destory(_root);_root = nullptr;}
private:void Destory(Node* root){if (root == nullptr) return;Destory(root->_left);Destory(root->_right);delete root;}
4.二叉搜索树key和key/value使用场景
4.1key搜索场景
只有key作为关键码,结构中只需要存储key即可,关键码即为需要搜索到的值,搜索场景只需要判断key在不在。key的搜索场景实现的⼆叉树搜索树⽀持增删查,但是不⽀持修改,修改key破坏搜索树结构了。
场景1:⼩区⽆⼈值守⻋库,⼩区⻋库买了⻋位的业主⻋才能进⼩区,那么物业会把买了⻋位的业主的⻋牌号录⼊后台系统,⻋辆进⼊时扫描⻋牌在不在系统中,在则抬杆,不在则提⽰⾮本⼩区⻋辆,⽆法进⼊。
场景2:检查⼀篇英⽂ 章单词拼写是否正确,将词库中所有单词放⼊⼆叉搜索树,读取⽂章中的单词,查找是否在⼆叉搜索树中,不在则波浪线标红提⽰。
(上述第三点讲的就是key二叉搜索树的实现)
4.2key_value搜索场景
每⼀个关键码key,都有与之对应的值value,value可以任意类型对象。树的结构中(结点)除了需要存储key还要存储对应的value,增/删/查还是以key为关键字⾛⼆叉搜索树的规则进⾏⽐较,可以快速查找到key对应的value。key/value的搜索场景实现的⼆叉树搜索树⽀持修改,但是不⽀持修改key,修改key破坏搜索树性质了,可以修改value。
场景1:简单中英互译字典,树的结构中(结点)存储key(英⽂)和vlaue(中⽂),搜索时输⼊英⽂,则同时查找到了英⽂对应的中⽂。
场景2:商场⽆⼈值守⻋库,⼊⼝进场时扫描⻋牌,记录⻋牌和⼊场时间,出⼝离场时,扫描⻋牌,查找⼊场时间,⽤当前时间-⼊场时间计算出停⻋时⻓,计算出停⻋费⽤,缴费后抬杆,⻋辆离场。
场景3:统计⼀篇⽂章中单词出现的次数,读取⼀个单词,查找单词是否存在,不存在这个说明第⼀次出现,(单词,1),单词存在,则++单词对应的次数。
namespace key_value
{// 结构template<class K,class V>struct BSTNode{K _key;V _value;BSTNode<K, V>* _left;BSTNode<K, V>* _right;// 默认构造BSTNode(const K& key,const V& value):_key(key), _value(value), _left(nullptr), _right(nullptr){}};template<class K,class V>class BSTree{// typedef BSTNode<K> Node;using Node = BSTNode<K,V>;public:// 因为写了拷贝构造,不会生成默认构造函数,C++11支持强制生成BSTree() = default;// 强制生成默认构造BSTree(const BSTree& t){_root = Copy(t._root);}BSTree& operator=(BSTree tmp){swap(_root, tmp._root);return *this;}~BSTree(){Destory(_root);_root = nullptr;}// 不允许插入相同的数字bool Insert(const K& key,const V& value){if (_root == nullptr){_root = new Node(key,value);return true;}Node* cur = _root;Node* parent = nullptr;// 新节点需要插入到空位置while (cur != nullptr){if (key < cur->_key){parent = cur;cur = cur->_left;}else if (key > cur->_key){parent = cur;cur = cur->_right;}else return false;}// 找到插入位置了cur = new Node(key,value);if (key < parent->_key) parent->_left = cur;else parent->_right = cur;return true;}Node* Find(const K& key){Node* cur = _root;while (cur != nullptr){if (cur->_key == key) return cur;else if (cur->_key > key) cur = cur->_left;else cur = cur->_right;}return nullptr;}bool Erase(const K& key){Node* parent = nullptr;Node* cur = _root;while (cur != nullptr){if (cur->_key > key){parent = cur;cur = cur->_left;}else if (cur->_key < key){parent = cur;cur = cur->_right;}else{// 如果删除的是头节点// 没孩子或只有一个孩子可以归类为一种情况// 左为空if (cur->_left == nullptr){// 如果删除的是头节点if (cur == _root) _root = cur->_right;else{if (parent->_left == cur) parent->_left = cur->_right;else parent->_right = cur->_right;}delete cur;}else if (cur->_right == __nullptr){if (cur == _root) _root = cur->_left;else{if (parent->_left == cur) parent->_left = cur->_left;else parent->_right = cur->_left;}delete cur;}// 有两个孩子,需要挑选左子树的最右节点/右子树的最左节点充当该节点else{// 找右子树的最左节点Node* replaceParent = cur;Node* replace = cur->_right;while (replace->_left != nullptr){replaceParent = replace;replace = replace->_left;}// 交换删除节点和替代节点的值cur->_key = replace->_key;//需要考虑这个最左节点有没有右孩子,同时也需要改变其父节点的指向if (replaceParent->_right == replace)// 右子树没有左孩子的情况replaceParent->_right = replace->_right;elsereplaceParent->_left = replace->_right;// 删除替换节点即可delete replace;}return true;}}// 数据不存在return false;}// 中序遍历二叉搜索树void Inorder(){// 因为遍历需要头节点,但_root是私有的,在外面不能直接调用_Inorder(_root);cout << endl;}private:void _Inorder(Node* root){if (root == nullptr) return;_Inorder(root->_left);cout << root->_key << ":" << root->_value << endl;_Inorder(root->_right);}Node* Copy(Node* root){if (root == nullptr) return nullptr;Node* newRoot = new Node(root->_key,root->_value);newRoot->_left = Copy(root->_left);newRoot->_right = Copy(root->_right);return newRoot;}void Destory(Node* root){if (root == nullptr) return;Destory(root->_left);Destory(root->_right);delete root;}Node* _root = nullptr;};
}