目录
并查集的概念
并查集就是拥有合并和查询功能的集合的集合。现在假设有下面三个集合:
{1、5、6、2},{3、4},{7、9、8}
现在从每个集合中选定一个元素作为这个集合的标志,假设这里选取1、3、7为标志,其他元素都挂靠在这个标志底下,使用树形结构进行存储,如下图所示:
这里需要注意他们没有实际的父子关系,只是同在一个集合里。
那么并查集需要做什么呢?查询操作指的是给定一个x,能够找到x所属集合的标志节点,即根节点。这里以2为例,其集合的标志节点为1;而合并操作指的是给定两个集合,需要把其中一个集合并到另一个集合里,即把一个集合的根节点连到另一个集合的根节点。合并7、3集合如下所示:
并查集的基本操作
并查集的表示
由上可以知道并查集的操作针对的元素主要是每个集合的标志节点,即根节点,所以使用树的双亲表示法来表示并查集会显得很方便。现在规定S[]数组用于存储每个节点的双亲,S[根节点]=集合中元素数量的相反数,那么就有下图所示的存储结构:
代码表示如下:
#define SIZE 50
int UFsets[SIZE];
初始化
初始化定义一个循环把所有独立元素的UFsets都初始化为-1。
void Initial(int S[]){
for(int i=0;i<SIZE;i++)
S[i]=-1;
}
查询
int Find(int S[],int x){
while(S[x]>=0) //循环向上查找根节点
x=S[x];
return x; //返回根节点
}
合并
void Union(int S[],int Root1,int Root2){
if(Root1==Root2) //同属一个集合则返回
return;
S[Root1]=Root2; //将一个根连到另一个下面
}
并查集的优化
上面提到的简单并查集查询方法最坏情况下时间复杂度为O(n),如何改进?方法有二,第一是优化合并操作,第二是优化Find操作。
对于Union的优化,如果把小树(即集合元素的数量比较小的树)连到大树的根上,显然会比把大树连到小树根上提高查询的效率,代码如下:
void Union(int S[],int Root1,int Root2){
if(S[Root1]=S[Root2])
return;
if(S[Root1]>S[Root2]){ //第一棵树节点更少(注意这里是负数)
S[Root2]+=S[Root1]; //叠加节点数
S[Root1]=Root2; //归根
}
else{
S[Root1]+=S[Root2]; //叠加节点数
S[Root2]=Root1; //归根
}
}
由数学归纳法可知这种方法造出的树深度不超过(不是很有必要知道推导过程)。
而对于Find的优化,可以知道如果所有的集合都只有两层(根节点和其他节点),那么查询的时间复杂度会大大下降。所以可以写一个循环把根节点到给定节点路径上的所有节点都归到根节点底下,优化代码如下:
int Find(int S[],int x){
int t;
int root=x;
while(S[root]>=0) //找到根
root=S[root];
while(x!=root){ //压缩路径
t=S[x];
S[x]=root;
x=t;
}
return root;
}
通过 Find 操作的“压缩路径”优化后,可使集合树的深度不超过 O(),其中
是一个增长极其缓慢的函数,对于常见的正整数 n,通常
<4。