【C++】红黑树实现

发布于:2025-07-28 ⋅ 阅读:(12) ⋅ 点赞:(0)

目录

1. 红黑树的概念

1.1 红黑树的规则:

1.2 思考一下,红黑树如何确保最长路径不超过最短路径的2倍的?

1.3 红黑树的效率:

2. 红黑树的实现

2.1 红黑树的结构

2.2 红黑树的插入

2.2.1 红黑树树插入一个值的大概过程

2.2.2 情况1:变色

2.2.3 情况2:单旋+变色

2.2.4 情况2:双旋+变色

2.3 红黑树的插入代码实现

2.4 红黑树的查找

2.5 红黑树的验证

2.6 红黑树的删除


1. 红黑树的概念

红黑树是在一棵二叉搜索树基础上,通过每个结点增加一个存储位来表示结点的颜色,可以是红色或者黑色,对任何一条从根到叶子的路径上各个结点的颜色进行约束,确保没有一条路径会比其他路径长出2倍,因而是接近平衡的。

1.1 红黑树的规则:

1. 每个结点不是红色就是黑色


2. 根结点是黑色的


3. 如果一个结点是红色的,则它的两个孩子结点必须是黑色的,也就是说任意一条路径不会有连续的红色结点


4. 对于任意一个结点,从该结点到其所有NULL结点的简单路径上,均包含相同数量的黑色结点

说明:《算法导论》等书籍上补充了一条每个叶子结点(NIL)都是黑色的规则。他这里所指的叶子结点不是传统的意义上的叶子结点,而是我们说的空结点,有些书籍上也把NIL叫做外部结点。NIL是为了方便准确的标识出所有路径,《算法导论》在后续讲解实现的细节中也忽略了NIL结点,所以我们知道一下这个概念即可。

上文规则中所提到的结点到其所有NULL结点的简单路径,就是下图中带上NIL的路径,即我们在衡量不同路径的黑色节点时,一定要带上未画出的空节点。

1.2 思考一下,红黑树如何确保最长路径不超过最短路径的2倍的?

• 由规则4可知,从根到NULL结点的每条路径都有相同数量的黑色结点,所以极端场景下,最短路径就就是全是黑色结点的路径,假设最短路径长度为bh(black height)


• 由规则2和规则3可知,任意一条路径不会有连续的红色结点并且根节点是黑色的,所以极端场景下,最长的路径就是一黑一红间隔组成,那么最长路径的长度为2*bh


• 综合红黑树的4点规则而言,理论上的全黑最短路径和一黑一红的最长路径并不是在每棵红黑树都存在的假设任意一条从根到NULL结点路径的长度为x,那么bh <= h <= 2*bh

1.3 红黑树的效率:

假设N是红黑树树中结点数量,h最短路径的长度,那么2^{h} - 1 <= N < 2^{2*h} - 1 ,根据前面二叉搜索树文章中的结论推出h\approx logN,也就是意味着红黑树增删查改最坏也就是走最长路径 2*logN,那么时间复杂度还是O(logN)

红黑树的表达相对AVL树要抽象一些,AVL树通过高度差直观的控制了平衡,并且是严格控制。而红黑树通过4条规则的颜色约束,间接的实现了近似平衡,控制的并不严格,但是他们效率都是同一档次(量级上在同一层次),但是相对而言,插入相同数量的结点,红黑树的旋转次数是更少的,因为他对平衡的控制没那么严格,效率上红黑树稍微有一些优势,所以在实际应用中,红黑树比起AVL树使用更加广泛。

2. 红黑树的实现

2.1 红黑树的结构

红黑树节点设计,我们使用枚举值来表示颜色,因为红黑树的处理方式也涉及旋转,因此这我们沿用三叉链的结构(不了解旋转相关概念,可查阅前文AVL树文章,下文不再介绍)。

// 枚举值表示颜色
enum Colour
{
	RED,
	BLACK
};
// 这里我们默认按key/value结构实现
template<class K, class V>
struct RBTreeNode
{
	// 这里更新控制平衡也要加入parent指针
	pair<K, V> _kv;
	RBTreeNode<K, V>* _left;
	RBTreeNode<K, V>* _right;
	RBTreeNode<K, V>* _parent;
	Colour _col;
	RBTreeNode(const pair<K, V>& kv)
		:_kv(kv)
		, _left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
	{
	}
};
template<class K, class V>
class RBTree
{
	typedef RBTreeNode<K, V> Node;
public:
private:
	Node* _root = nullptr;
};

2.2 红黑树的插入

2.2.1 红黑树树插入一个值的大概过程

1.插入一个值按二叉搜索树规则进行插入,插入后我们只需要观察是否符合红黑树的4条规则,不符合就进行处理(旋转、变色)。

2. 如果是空树插入,新增结点是黑色结点(保证根节点是黑色)。如果是非空树插入,新增结点必须红色结点,因为非空树插入,如果插入黑色节点,不同路径黑色节点不相等,就破坏了规则4,规则4是很难维护的。


3. 非空树插入完成后,如果新增节点的父亲结点是黑色的,则没有违反任何规则,插入结束


4. 非空树插入完成后,如果新增节点的父亲结点是红色的那么父节点和孩子节点都是红色节点,违反规则3。这个时候红黑树性质破坏,我们就需要进行处理。

进一步分析,新增节点是红色,父亲节点为红,爷爷节点必为黑(如果爷爷节点为红,之前就会进行处理,不会留到现在处理),这三个颜色都固定了,为了保证树依旧满足红黑树的几条规则,关键的变化看叔叔节点的情况,需要根据叔叔节点分为以下几种情况分别处理

说明:下图中假设我们把新增结点标识为c (cur),c的父亲标识为p(parent),p的父亲标识为
g(grandfather),p的兄弟标识为u(uncle)

2.2.2 情况1:变色

c为红,p为红,g为黑,u存在且为红,则将p和u变黑,g变红。再把g当做新的c,继续往上更新


分析:因为p和u都是红色,g是黑色,把p和u变黑,左边子树路径各增加一个黑色结点,g再变红,相当于保持g所在子树的黑色结点的数量不变,同时解决了c和p连续红色结点的问题。需要继续往上更新是因为,g是红色,如果g的父亲还是红色,那么就还需要继续处理如果g的父亲是黑色,则处理结束了;如果g就是整棵树的根,再把g变回黑色

 

情况1只变色,不旋转。所以无论c是p的左还是右,p是g的左还是右,都是上面的变色处理方式。

图0

• 跟AVL树部分类似,图0我们展示了一种具体情况,但是实际中需要这样处理的有很多种情况。


• 图1将以上类似的处理进行了抽象表达,d/e/f代表每条路径拥有hb个黑色结点的子树,a/b代表每条路径拥有hb-1个黑色结点的根为红的子树,hb>=0。


• 图2/图3/图4,分别展示了hb == 0/hb == 1/hb == 2的具体情况组合分析,当hb等于2时,这里组合情况上百亿种,这些样例是帮助我们理解,不论情况多少种,多么复杂,处理方式一样的,变色再继续往上处理即可,所以我们只需要看抽象图即可。

图1
图2
图3
图4

2.2.3 情况2:单旋+变色

c为红,p为红,g为黑,u不存在或者u存在且为黑(u不存在,则c一定是新增结点,u存在且为黑,则c一定不是新增,c之前是黑色的,是在c的子树中插入,符合情况1,变色将c从黑色变成红色,更新上来的。)


分析:p必须变黑,才能解决,连续红色结点的问题,u不存在或者是黑色的,这里单纯的变色无法解决问题,需要旋转+变色

如果p是g的左,c是p的左,那么以g为旋转点进行右单旋,再把p变黑,g变红即可。p变成课这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为p的父亲是黑色还是红色或者空都不违反规则。

如果p是g的右,c是p的右,那么以g为旋转点进行左单旋,再把p变黑,g变红即可。p变成课这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为p的父亲是黑色还是红色或者空都不违反规则。

图1

2.2.4 情况2:双旋+变色

c为红,p为红,g为黑,u不存在或者u存在且为黑。(u不存在,则c一定是新增结点,u存在且为黑,则c一定不是新增,c之前是黑色的,是在c的子树中插入,符合情况1,变色将c从黑色变成红色,更新上来的。)


分析:p必须变黑,才能解决,连续红色结点的问题,u不存在或者是黑色的,这里单纯的变色无法解决问题,需要旋转+变色

如果p是g的左,c是p的右,那么先以p为旋转点进行左单旋,再以g为旋转点进行右单旋,再把c变黑,g变红即可。c变成课这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为c的父亲是黑色还是红色或者空都不违反规则。

如果p是g的右,c是p的左,那么先以p为旋转点进行右单旋,再以g为旋转点进行左单旋,再把c变黑,g变红即可。c变成课这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为c的父亲是黑色还是红色或者空都不违反规则。

图1

2.3 红黑树的插入代码实现

// 旋转代码的实现跟AVL树是一样的,只是不需要更新平衡因子
bool Insert(const pair<K, V>& kv)
{
	if (_root == nullptr)
	{
		_root = new Node(kv);
		_root->_col = BLACK;
		return true;
	}
	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return false;
		}
	}
	cur = new Node(kv);
	// 新增结点。颜色红色给红色
	cur->_col = RED;
	if (parent->_kv.first < kv.first)
	{
		parent->_right = cur;
	}
	else
	{
		parent->_left = cur;
	}
	cur->_parent = parent;
	while (parent && parent->_col == RED)
	{
		Node* grandfather = parent->_parent;
		// g
		// p u
		if (parent == grandfather->_left)
		{
			Node* uncle = grandfather->_right;
			if (uncle && uncle->_col == RED)
			{
				// u存在且为红 -》变色再继续往上处理
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;
				cur = grandfather;
				parent = cur->_parent;
			}
			else
			{
				// u存在且为黑或不存在 -》旋转+变色
				if (cur == parent->_left)
				{
					// g
					// p u
					//c
					//单旋
					RotateR(grandfather);
					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				else
				{
					// g
					// p u
					// c
					//双旋
					RotateL(parent);
					RotateR(grandfather);
					cur->_col = BLACK;
					grandfather->_col = RED;
				}
				break;
			}
		}
		else
		{
			// g
			// u p
			Node* uncle = grandfather->_left;
			// 叔叔存在且为红,-》变色即可
			if (uncle && uncle->_col == RED)
			{
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;
				// 继续往上处理
				cur = grandfather;
				parent = cur->_parent;
			}
			else // 叔叔不存在,或者存在且为黑
			{
				// 情况二:叔叔不存在或者存在且为黑
				// 旋转+变色
				// g
				// u p
				// c
				if (cur == parent->_right)
				{
					RotateL(grandfather);
					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				else
				{
					// g
					// u p
					// c
					RotateR(parent);
					RotateL(grandfather);
					cur->_col = BLACK;
					grandfather->_col = RED;
				}
				break;
			}
		}
	}

	_root->_col = BLACK;//必须确保根是黑色
                        //直接赋值避免繁杂的条件判断
	return true;
}

2.4 红黑树的查找

按二叉搜索树逻辑实现即可,搜索效率为 O(logN)

Node* Find(const K& key)
{
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < key)
		{
			cur = cur->_right;
		}
		else if (cur->_kv.first > key)
		{
			cur = cur->_left;
		}
		else
		{
			return cur;
		}
	}
	return nullptr;
}

2.5 红黑树的验证

红黑树的验证,我们必须确保红黑树的几天规则满足,这里获取最长路径和最短路径,检查最长路径不超过最短路径的2倍是不可行的,因为这个条件是红黑树的必要条件,不是充分条件,就算满足这个条件,红黑树也可能颜色不满足规则,当前暂时没出问题,后续继续插入还是会出问题的。所以我们还是去检查4点规则,满足这4点规则,一定能保证最长路径不超过最短路径的2倍。


1. 规则1枚举颜色类型,天然实现保证了颜色不是黑色就是红色


2. 规则2直接检查根即可


3. 规则3前序遍历检查,遇到红色结点查孩子不太方便,因为孩子有两个也可能只有一个或者都不存在,如果我们检查孩子,需要考虑的分支情况太多,但是反过来检查父亲的颜色就方便多了,因为明确节点存在的情况下,必然存在且只存在一个父亲


4. 规则4前序遍历,选取任意一条路径黑色结点数量作为参考值,然后遍历每一路径到空节点,用形参记录跟到当前结点的blackNum(黑色结点数量),前序遍历遇到黑色结点就++blackNum,走到空就计算出了一条路径的黑色结点数量,然后与参考值比较,不相等就说明不同路径的黑色节点不相等

bool Check(Node* root, int blackNum, const int refNum)
{
	if (root == nullptr)
	{
		// 前序遍历走到空时,意味着一条路径走完了
		//cout << blackNum << endl;
		if (refNum != blackNum)
		{
			cout << "存在黑色结点的数量不相等的路径" << endl;
			return false;
		}
		return true;
	}
	// 检查孩子不太方便,因为孩子有两个,且不一定存在,反过来检查父亲就方便多了
	if (root->_col == RED && root->_parent->_col == RED)
	{
		cout << root->_kv.first << "存在连续的红色结点" << endl;
		return false;
	}
	if (root->_col == BLACK)
	{
		blackNum++;
	}
	return Check(root->_left, blackNum, refNum)
		&& Check(root->_right, blackNum, refNum);
}
bool IsBalance()
{
	if (_root == nullptr)
		return true;
	if (_root->_col == RED)
		return false;
	// 参考值
	int refNum = 0;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_col == BLACK)
		{
			++refNum;
		}
		cur = cur->_left;
	}
	return Check(_root, 0, refNum);
}

2.6 红黑树的删除

红黑树的删除本章节不做讲解,有兴趣的读者可参考:《算法导论》或者《STL源码剖析》中讲解。


网站公告

今日签到

点亮在社区的每一天
去签到