数据结构 - 平衡二叉树(AVL树)概念 | 插入与平衡调整

发布于:2023-01-05 ⋅ 阅读:(235) ⋅ 点赞:(0)

目录

 

前言 

AVL树的概念

AVL树结点的定义

AVL树的插入

AVL树的平衡调整(重点)

LL型不平衡(需右单旋转)

RR型不平衡(需左单旋转)

LR型不平衡(需左右双旋转)

RL型不平衡(需右左双旋转)

AVL树简单实现以及验证-插入

 完整代码实现:


前言 

前面对 map/multimap/set/multiset 进行了简单的介绍,在其文档介绍中发现,这几个容器有个
共同点是: 其底层都是按照二叉搜索树来实现的 ,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N) ,因此map、 set 等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。

AVL树的概念

二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii 和E.M.Landis在1962年 发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的 绝对值 不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均 搜索长度。

一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:

  • 它的左右子树都是AVL树
  • 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)

如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在

O(log2_ n),搜索时间复杂度O(log2_ n)

AVL树结点的定义

我们这里直接实现KV模型的AVL树,为了方便后续的操作,这里将AVL树中的结点定义为三叉链结构,并在每个结点当中引入平衡因子(右子树高度-左子树高度)。除此之外,还需编写一个构造新结点的构造函数,由于新构造结点的左右子树均为空树,于是将新构造结点的平衡因子初始设置为0即可。

template<class T>
struct AVLTreeNode
{
	AVLTreeNode(const T& data)
		: _pLeft(nullptr), _pRight(nullptr), _pParent(nullptr)
		, _data(data), _bf(0)
	{}
	AVLTreeNode<T>* _pLeft;   // 该节点的左孩子
	AVLTreeNode<T>* _pRight;  // 该节点的右孩子
	AVLTreeNode<T>* _pParent; // 该节点的双亲
	T _data;
	int _bf;                  // 该节点的平衡因子
};

注意: 

  • 给每个结点增加平衡因子并不是必须的,只是实现AVL树的一种方式,不引入平衡因子也可以实现AVL树,只不过会麻烦一点 
  • 树中最大元素一定是无左子树,因为最大元素如果存在左子树,中序遍历就不可能是降序序列
  • 插入时,AVL树最多只需要旋转两次

AVL树的插入

AVL树插入结点时有以下三个步骤:

  1. 按照二叉搜索树的插入方法,找到待插入位置。
  2. 找到待插入位置后,将待插入结点插入到树中。
  3. 更新平衡因子,如果出现不平衡,则需要进行旋转。

因为AVL树本身就是一棵二叉搜索树,因此寻找结点的插入位置是非常简单的,按照二叉搜索树的插入规则:

  1. 待插入结点的key值比当前结点小就插入到该结点的左子树。
  2. 待插入结点的key值比当前结点大就插入到该结点的右子树。
  3. 待插入结点的key值与当前结点的key值相等就插入失败。

如此进行下去,直到找到与待插入结点的key值相同的结点判定为插入失败,或者最终走到空树位置进行结点插入。

AVL树的平衡调整(重点)

向AVL树中插入新数据

  • 和BST一样,首先在叶节点插入数据
  • 若插入导致不平衡,则需对以插入路径上离插入节点最近的平衡因子绝对值大于1的节点为根的树进行调整
     

LL型不平衡(需右单旋转)

  • 在某个子树的左子树的左子树上插入新节点,导致根节点的平衡因子由1变为2

右单旋的步骤如下:

  1. 让y的右子树作为x的左子树。
  2. 让x作为y的右子树。
  3. 让y作为整个子树的根。
  4. 更新平衡因子。

右单旋后满足二叉搜索树的性质:

  1. y的右子树当中结点的值本身就比x的值小,因此可以作为x的左子树。
  2. x及其右子树当中结点的值本身就比y的值大,因此可以作为y的右子树。

 右单选代码实现

void RotateR(Node* pParent)
	{
		Node* pSubL = pParent->_pLeft;
		Node* pSubLR = pSubL->_pRight;
 
		// 改变pParent和pSubL孩子的指向
		pParent->_pLeft = pSubLR;
		if (pSubLR)
			pSubLR->_pParent = pParent;
 
		pSubL->_pRight = pParent;
 
		// 更新pParent和pSubL的双亲
		Node* pPParent = pParent->_pParent;
		pParent->_pParent = pSubL;
		pSubL->_pParent = pPParent;
 
		// 更新原pParent双亲的左||右指针域指向
		if (nullptr == pPParent)
		{
			_pRoot = pSubL;
		}
		else
		{
			if (pParent == pPParent->_pLeft)
				pPParent->_pLeft = pSubL;
			else
				pPParent->_pRight = pSubL;
		}
 
		pParent->_bf = pSubL->_bf = 0;
	}

RR型不平衡(需左单旋转)

  • 在某个子树的右子树的右子树上插入新节点,导致根节点的平衡因子由-1变为-2 


左单旋的步骤如下:

  1. 让y的左子树作为x的右子树。
  2. 让x作为y的左子树。
  3. 让y作为整个子树的根。
  4. 更新平衡因子。

左单旋后满足二叉搜索树的性质:

  1. y的左子树当中结点的值本身就比x的值大,因此可以作为x的右子树。
  2. x及其左子树当中结点的值本身就比y的值小,因此可以作为y的左子树。

 左单旋代码实现


	void RotateL(Node* pParent)
	{
		Node* pSubR = pParent->_pRight;
		Node* pSubRL = pSubR->_pLeft;
 
		pParent->_pRight = pSubRL;
		if (pSubRL)
			pSubRL->_pParent = pParent;
 
		pSubR->_pLeft = pParent;
		Node* pPParent = pParent->_pParent;
		pParent->_pParent = pSubR;
		pSubR->_pParent = pPParent;
 
		if (nullptr == pPParent)
		{
			_pRoot = pSubR;
		}
		else
		{
			if (pParent == pPParent->_pLeft)
				pPParent->_pLeft = pSubR;
			else
				pPParent->_pRight = pSubR;
		}
 
		pParent->_bf = pSubR->_bf = 0;
	}

LR型不平衡(需左右双旋转)

  • 在某个子树的左子树的右子树上插入新节点,导致根节点的平衡因子由1变为2

左右双旋的步骤如下:

  1. 以y为旋转点进行左单旋。
  2. 以x为旋转点进行右单旋。
  3. 更新平衡因子。

左右双旋后满足二叉搜索树的性质:
左右双旋后,实际上就是让z的左子树和右子树,分别作为y和x的右子树和左子树,再让y和x分别作为z的左右子树,最后让z作为整个子树的根(结合图理解)。

  1. z的左子树当中的结点本身就比y的值大,因此可以作为y的右子树。
  2. z的右子树当中的结点本身就比x的值小,因此可以作为x的左子树。
  3. 经过步骤1/2后,y及其子树当中结点的值都就比z的值小,而x及其子树当中结点的值都就比z的值大,因此它们可以分别作为z的左右子树。

 左右双旋转代码实现

void RotateRL(Node* pParent)
	{
		Node* pSubR = pParent->_pRight;
		Node* pSubRL = pSubR->_pLeft;
		int bf = pSubRL->_bf;
 
		RotateR(pParent->_pRight);
		RotateL(pParent);
 
		// 更新部分节点的平衡因子
		if (bf == -1)
			pSubR->_bf = 1;
		else if (bf == 1)
			pParent->_bf = -1;
	}

RL型不平衡(需右左双旋转)

  • 在某个子树的右子树的左子树上插入新节点,导致根节点的平衡因子由-1变为-2

右左双旋的步骤如下:

  1. 以y为旋转点进行右单旋。
  2. 以x为旋转点进行左单旋。
  3. 更新平衡因子。

右左双旋后满足二叉搜索树的性质:
右左双旋后,实际上就是让z的左子树和右子树,分别作为x和y的右子树和左子树,再让x和y分别作为x的左右子树,最后让z作为整个子树的根(结合图理解)。

  1. z的左子树当中的结点本身就比x的值大,因此可以作为x的右子树。
  2. z的右子树当中的结点本身就比y的值小,因此可以作为y的左子树。
  3. 经过步骤1/2后,x及其子树当中结点的值都就比z的值小,而y及其子树当中结点的值都就比z的值大,因此它们可以分别作为z的左右子树。

右左双旋转代码实现

void RotateLR(Node* pParent)
	{
		Node* pSubL = pParent->_pLeft;
		Node* pSubLR = pSubL->_pRight;
		int bf = pSubLR->_bf;
 
		RotateL(pParent->_pLeft);
		RotateR(pParent);
		if (-1 == bf)
			pParent->_bf = 1;
		else if (1 == bf)
			pSubL->_bf = -1;
	}

AVL树简单实现以及验证-插入

函数接口

template<class T>
struct AVLTreeNode
{
	AVLTreeNode(const T& data = T())
	: _pLeft(nullptr)
	, _pRight(nullptr)
	, _pParent(nullptr)
	, _data(data)
	, _bf(0)
	{}
 
	AVLTreeNode<T>* _pLeft;
	AVLTreeNode<T>* _pRight;
	AVLTreeNode<T>* _pParent;
	T _data;
	int _bf;   // 节点的平衡因子
};
 
 
// AVL: 二叉搜索树 + 平衡因子的限制
template<class T>
class AVLTree
{
	typedef AVLTreeNode<T> Node;
public:
	AVLTree()
		: _pRoot(nullptr)
	{}
 
    // 在AVL树中插入值为data的节点
	bool Insert(const T& data);
    
    // AVL树的验证
	bool IsAVLTree()
	{
		return _IsAVLTree(_pRoot);
	}
 
private:
    // 根据AVL树的概念验证pRoot是否为有效的AVL树
	bool _IsAVLTree(Node* pRoot);
	size_t _Height(Node* pRoot);
    // 右单旋
	void RotateR(Node* pParent);
    // 左单旋
	void RotateL(Node* pParent);
    // 右左双旋
	void RotateRL(Node* pParent);
    // 左右双旋
	void RotateLR(Node* pParent);
 
private:
	Node* _pRoot;
};

 完整代码实现:

template<class T>
struct AVLTreeNode
{
	AVLTreeNode(const T& data = T())
	: _pLeft(nullptr)
	, _pRight(nullptr)
	, _pParent(nullptr)
	, _data(data)
	, _bf(0)
	{}
 
	AVLTreeNode<T>* _pLeft;
	AVLTreeNode<T>* _pRight;
	AVLTreeNode<T>* _pParent;
	T _data;
	int _bf;   // 节点的平衡因子
};
 
 
 
// AVL: 二叉搜索树 + 平衡因子的限制
template<class T>
class AVLTree
{
	typedef AVLTreeNode<T> Node;
public:
	AVLTree()
		: _pRoot(nullptr)
	{}
 
	bool Insert(const T& data)
	{
		// 先按照二叉搜索树的方式进行插入
		if (nullptr == _pRoot)
		{
			_pRoot = new Node(data);
			return true;
		}
 
		// 按照二叉搜索树特性:找待插入节点在树中的位置
		// 并保存其双亲
		Node* pCur = _pRoot;
		Node* pParent = nullptr;
		while (pCur)
		{
			pParent = pCur;
			if (data < pCur->_data)
				pCur = pCur->_pLeft;
			else if (data > pCur->_data)
				pCur = pCur->_pRight;
			else
				return false;
		}
 
		// 插入新节点
		pCur = new Node(data);
		if (data < pParent->_data)
			pParent->_pLeft = pCur;
		else
			pParent->_pRight = pCur;
		pCur->_pParent = pParent;
 
		while (pParent)
		{
			// 更新pParent的平衡因子
			if (pCur == pParent->_pLeft)
				pParent->_bf--;
			else
				pParent->_bf++;
 
			if (0 == pParent->_bf)
				break;
			else if (-1 == pParent->_bf || 1 == pParent->_bf)
			{
				pCur = pParent;
				pParent = pCur->_pParent;
			}
			else
			{
				// pParent->_bf: 2 || -2
				// pParent的节点失去平衡
				if (2 == pParent->_bf)
				{
					// 右子树高-->最后必须左单旋
					if (1 == pCur->_bf)
						RotateL(pParent);
					else
						RotateRL(pParent);
				}
				else
				{
					if (-1 == pCur->_bf)
						RotateR(pParent);
					else
						RotateLR(pParent);
				}
 
				break;
			}
		}
		
		return true;
	}
 
	void InOrder()
	{
		_InOrder(_pRoot);
	}
 
	Node* LeftMost()
	{
		if (nullptr == _pRoot)
			return nullptr;
 
		Node* pCur = _pRoot;
		while (pCur->_pLeft)
			pCur = pCur->_pLeft;
 
		return pCur;
	}
 
	Node* RightMost()
	{
		if (nullptr == _pRoot)
			return nullptr;
 
		Node* pCur = _pRoot;
		while (pCur->_pRight)
			pCur = pCur->_pRight;
 
		return pCur;
	}
 
	bool IsAVLTree()
	{
		return _IsAVLTree(_pRoot);
	}
 
private:
    // 验证二叉搜索树是否为有效的
	bool _IsAVLTree(Node* pRoot)
	{
		if (nullptr == pRoot)
			return true;
 
		int leftHeight = _Height(pRoot->_pLeft);
		int rightHeight = _Height(pRoot->_pRight);
 
		if (abs(rightHeight - leftHeight) > 1 ||
			rightHeight - leftHeight != pRoot->_bf)
			return false;
 
		return _IsAVLTree(pRoot->_pLeft) && _IsAVLTree(pRoot->_pRight);
	}
 
	size_t _Height(Node* pRoot)
	{
		if (nullptr == pRoot)
			return 0;
 
		size_t leftHeight = _Height(pRoot->_pLeft);
		size_t rightHeight = _Height(pRoot->_pRight);
 
		return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
	}
 
 
	void RotateR(Node* pParent)
	{
		Node* pSubL = pParent->_pLeft;
		Node* pSubLR = pSubL->_pRight;
 
		// 改变pParent和pSubL孩子的指向
		pParent->_pLeft = pSubLR;
		if (pSubLR)
			pSubLR->_pParent = pParent;
 
		pSubL->_pRight = pParent;
 
		// 更新pParent和pSubL的双亲
		Node* pPParent = pParent->_pParent;
		pParent->_pParent = pSubL;
		pSubL->_pParent = pPParent;
 
		// 更新原pParent双亲的左||右指针域指向
		if (nullptr == pPParent)
		{
			_pRoot = pSubL;
		}
		else
		{
			if (pParent == pPParent->_pLeft)
				pPParent->_pLeft = pSubL;
			else
				pPParent->_pRight = pSubL;
		}
 
		pParent->_bf = pSubL->_bf = 0;
	}
 
	void RotateL(Node* pParent)
	{
		Node* pSubR = pParent->_pRight;
		Node* pSubRL = pSubR->_pLeft;
 
		pParent->_pRight = pSubRL;
		if (pSubRL)
			pSubRL->_pParent = pParent;
 
		pSubR->_pLeft = pParent;
		Node* pPParent = pParent->_pParent;
		pParent->_pParent = pSubR;
		pSubR->_pParent = pPParent;
 
		if (nullptr == pPParent)
		{
			_pRoot = pSubR;
		}
		else
		{
			if (pParent == pPParent->_pLeft)
				pPParent->_pLeft = pSubR;
			else
				pPParent->_pRight = pSubR;
		}
 
		pParent->_bf = pSubR->_bf = 0;
	}
 
	void RotateRL(Node* pParent)
	{
		Node* pSubR = pParent->_pRight;
		Node* pSubRL = pSubR->_pLeft;
		int bf = pSubRL->_bf;
 
		RotateR(pParent->_pRight);
		RotateL(pParent);
 
		// 更新部分节点的平衡因子
		if (bf == -1)
			pSubR->_bf = 1;
		else if (bf == 1)
			pParent->_bf = -1;
	}
 
	void RotateLR(Node* pParent)
	{
		Node* pSubL = pParent->_pLeft;
		Node* pSubLR = pSubL->_pRight;
		int bf = pSubLR->_bf;
 
		RotateL(pParent->_pLeft);
		RotateR(pParent);
		if (-1 == bf)
			pParent->_bf = 1;
		else if (1 == bf)
			pSubL->_bf = -1;
	}
 
	void _InOrder(Node* pRoot)
	{
		if (pRoot)
		{
			_InOrder(pRoot->_pLeft);
			cout << pRoot->_data << " ";
			_InOrder(pRoot->_pRight);
		}
	}
 
private:
	Node* _pRoot;
};