【刷题2025】高级数据结构（并查集+优先队列+图论）-EW帮帮网

1.并查集

（1）基础理论

并查集是一种树形的数据结构，用于处理一些不相交集合的合并及查询问题。比如，可以用并查集判断一个森林中有几棵树、某个节点是否属于某棵树。

并查集由一个整形数组 pre[] 和两个函数 find() 、 join() 构成。

数组 pre[] 记录了每个点的前驱结点
find(x) 函数用于查找指定节点x属于哪个集合
join(x,y) 函数用于合并两个节点x、y

# find函数，寻找最上层节点（代表元）
def find(x):				# 查找 x 最上层节点

	while(pre[x] != x):	    # 如果x的上层不是自己（则说明找到的人不是最上层节点）
		x = pre[x]			# x 继续找上层节点，直到找到最上层节点为止
	return x				# 返回最上层节点

# join函数，将两个节点合并到一棵树中
dfs join(x, y)                     # 将两个节点 x 和 y 合并到一棵树中

    fx, fy = find(x), find(y)      # 寻找 x, y 的代表元
    if(fx != fy)                   # 如果 x 和 y 的代表元不相等
        pre[fx]=fy                 # 则将 x 的代表元设置为 y

路径压缩算法：将x到根节点路径上的所有点的pre（上级）都设为根节点。

def find(x):               # 查找结点 x 的根结点 

    if pre[x] == x:
        return x		   # 递归出口：x 的代表元为 x 本身，即 x 为根结点
    pre[x] = find(pre[x])  # 找到 x 的上层节点，并将其上层节点更改为根节点
    return x	           # 将 x 到根节点路径上的所有节点的前驱结点更改为根节点

路径压缩算法（加权标记法）：用权值大小决定谁做前驱结点

def union(x, y)

    x, y = find(x), find(y)	  # 寻找 x,y 的代表元

    if x==y:
        return 				  # 如果 x,y 的代表元一致，不需要合并，直接返回

    if rank[x]>rank[y]:       # 如果 x 的高度大于 y，则令 y 的上级为 x
        pre[y]=x		
    else:				      # 否则
        if rank[x]==rank[y]:
            rank[y]++	      # 如果 x 的高度和 y 的高度相同，则令 y 的高度加1
        pre[x]=y			  # 让 x 的上级为 y

（2）字符串化繁为简

题目说明

给定一个输入字符串，字符串只可能由英文字母 ('a'~'z'、'A'~'Z' )和左右小括号 ('('、')')组成。当字符里存在小括号时，小括号是成对的，可以有一个或多个小括号对，小括号对不会嵌套，小括号对内可以包含1个或多个英文字母，也可以不包含英文字母。当小括号对内包含多个英文字母时，这些字母之间是相互等效的关系，而且等效关系可以在不同的小括号对之间传递，即当存在'a'和'b'等效和存在'b'和'c' 等效时，'a' 和 'c' 也等效，另外，同一个英文字母的大写字母和小写字母也相互等效 (即使它们分布在不同的括号对里)。
需要对这个输入字符串做简化，输出一个新的字符串，输出字符串里只需保留输入字符串里的没有被小括号对包含的字符(按照输入字符串里的字符顺序) ，并将每个字符替换为在小括号对里包含且字典序最小的等效字符。
如果简化后的字符串为空，请输出为"0"。

示例:
输入字符串为"never(dont)give(run)up(f)()"，初始等效字符集合为('d','o','n','t')、('r','u','n')，由于等效关系可以传递，因此最终等效字符集合为('d','o','n','t','r','u')，将输入字符串里的剩余部分按字典序最小的等效字符替换后得到"devedgivedp"。

输入描述

input_string
输入为 1 行，代表输入字符串。

输出描述

output_string
输出为 1 行，代表输出字符串。

补充说明

输入字符串的长度在 1 ~ 100000 之间。

示例
示例1
输入   ()abd
输出   abd
说明   输入字符串里没有被小括号包含的子字符串为"abd"，其中每个字符没有等效字符，输出为"abd"。
示例2
输入   (abd)demand(fb)for
输出   aemanaaor
说明   等效字符集为('a','b','d','f')，输入字符串里没有被小括号包含的子字符串集合为 "demandfor"，将其中字符替换为字典序最小的等效字符后输出为："aemanaaor"。
示例3
输入   ()happy(xyz)new(wxy)year(t)
输出   happwnewwear
说明   等效字符集为('x','y','z','w')，输入字符串里没有被小括号包含的子字符串集合为"happynewyear"，将其中字符替换为字典序最小的等效字符后输出为："happwnewwear"。
示例4
输入   ()abcdefgAC(a)(Ab)(C)
输出   AAcdefgAC
说明   等效字符集为('a','A','b')，输入字符里没有被小括号包含的子字符串集合为"abcdefgAC"，将其中字符替换为字典序最小的等效字符后输出为："AAcdefgAC"。

# 这道题给我的启示就是虽然看错了题但是也能AC 75%
# 想开点吧孩子

s = input()

# 并查集实现
class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)

        # 保证字典序小的字符优先为根
        if x_root < y_root:
            self.pre[y_root] = x_root
        else:
            self.pre[x_root] = y_root


def solve():
    
    new_s = []  # 主体字符容器
    equal = []  # 等效字符容器
    ufs = UnionFindSet(128)  # 使用并查集记录等效传递关系, 数组索引对应 0~127 ASCII码值的字符
    letters = set()  # set记录已被加入到ufs的字母
    isOpen = False  # isOpen标志，表示有没有遇到 '(' 字符

    for c in s:
        if c == '(':
            isOpen = True  # 接下来将开始收集等效字符
        elif c == ')':
            isOpen = False  # 某个()内的等效字符收集完成

            if len(equal) == 0:
                continue

            # 括号间等效传递
            for letter in equal:
                # 不同括号间的大小写字母可以形成等效传递
                upper = letter - 32
                lower = letter + 32

                # set记录的是之前括号里面出现过的字母
                if lower in letters:
                    ufs.join(letter, lower)

                if upper in letters:
                    ufs.join(letter, upper)

            # 括号内等效传递
            cur_root = equal[0]
            for letter in equal:
                ufs.join(letter, cur_root)
                letters.add(letter)  # 将当前()内字符加入set

            # 清空eq, 用于收集下个()内的字母
            equal.clear()
            
        elif isOpen:
            equal.append(ord(c))  # 等效字符容器
        else:
            new_s.append(ord(c))  # 主体字符容器

    # 等效替换
    for i in range(128):
        root = ufs.find(i)  # 找到i字母的等效的字典序最小的字母root

        # 将i替换为root
        for j in range(len(new_s)):
            if new_s[j] == i:
                new_s[j] = root

    res = "".join(map(lambda x: chr(x), new_s))

    if len(res) == 0:
        return("0")  # 如果简化后的字符串为空，请输出为"0"
    else:
        return(res)


print(solve())

（3）服务器广播

题目描述
服务器连接方式包括直接相连，间接连接。

A和B直接连接，B和C直接连接，则A和C间接连接。

直接连接和间接连接都可以发送广播。

给出一个N*N数组，代表N个服务器，

matrix[i][j] == 1，
则代表i和j直接连接；不等于 1 时，代表i和j不直接连接。

matrix[i][i] == 1，

即自己和自己直接连接。matrix[i][j] == matrix[j][i]。

计算初始需要给几台服务器广播，才可以使每个服务器都收到广播。

输入描述
输入为N行，每行有N个数字，为0或1，由空格分隔，

构成N*N的数组，N的范围为 1 <= N <= 40

输出描述
输出一个数字，为需要广播的服务器的数量

示例1

# 输入
1 0 0
0 1 0
0 0 1

# 输出
3

# 说明：3 台服务器互不连接，所以需要分别广播这 3 台服务器

示例2

# 输入
1 1
1 1

# 输出
1

# 说明：2 台服务器相互连接，所以只需要广播其中一台服务器

# 要在ufs的定义函数中做文章，self.pre可以不使用，也可以在init里定义其他需要用到的参数
# 本题中进行一次join操作相当于少了一个需要广播的计算机
# 因此对join函数进行改动

matrix = []
while True:
    try:
        matrix.append(list(map(int, input().split())))
    except:
        break

class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]
        self.count = n

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)

        if x_root != y_root:
            self.pre[y_root] = x_root
            self.count -= 1
        return

def solve():

    n = len(matrix)

    ufs = UnionFindSet(n)

    for i in range(n):
        for j in range(i, n):
            if matrix[i][j] == 1:
                ufs.join(i, j)

    return ufs.count

print(solve())

（4）走梅花桩

题目描述

少林寺武僧有一项训练科目就是走梅花桩，现在有 m 行 n 列的梅花桩，每个梅花桩都有一个高度，若相邻梅花桩之间的高度相差为 x，则可以走到相邻梅花桩上。

少林武僧可以选择任意起始位置，请你计算出少林武僧最多可以走多少个梅花桩。

输入描述

第一行输入 m 和 n 和 x，以空格分隔。m 和 n 不大于100。高度差 x 不大于10。

之后 m 行，每行 n 个数，分别表示梅花桩的高度。高度不大于100。

输出描述

请输出少林武僧最多可以走的梅花桩数量。

用例

输入

输出

# 竟然会做了！惊喜！
m, n, x = list(map(int, input().split()))
matrix = []
for _ in range(m):
    matrix.append(list(map(int, input().split())))
# print(matrix)

class UnionFindSet:
    def __init__(self, m, n):
        self.pre = [i for i in range(m*n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)
        if x_root != y_root:
            self.pre[y_root] = x_root



def solve():

    ufs = UnionFindSet(m, n)

    dir = ((-1, 0), (0, -1), (1, 0), (0, 1))

    for i in range(m):
        for j in range(n):
            for d in dir:
                newi = i + d[0]
                newj = j + d[1]
                if 0 <= newi < m and 0 <= newj < n and abs(matrix[i][j] - matrix[newi][newj]) <= x:
                    ufs.join(n*i+j, n*newi+newj)

                else:
                    continue

    ans = [0 for _ in range(m*n)]
    for index in range(m*n):
        ans[ufs.find(index)] += 1

    return max(ans)

print(solve())

（5）Linux 发行版的数量

题目描述
Linux操作系统有多个发行版，distrowatch.com提供了各个发行版的资料。这些发行版互相存在关联，例如Ubuntu基于Debian开发，而Mint又基于Ubuntu开发，那么我们认为Mint同Debian也存在关联。

发行版集是一个或多个相关存在关联的操作系统发行版，集合内不包含没有关联的发行版。

给你一个 n * n 的矩阵 isConnected，其中 isConnected[i][j] = 1 表示第 i 个发行版和第 j 个发行版直接关联，而 isConnected[i][j] = 0 表示二者不直接相连。

返回最大的发行版集中发行版的数量。

输入描述
第一行输入发行版的总数量N，

之后每行表示各发行版间是否直接相关

输出描述
输出最大的发行版集中发行版的数量

备注
1 ≤ N ≤ 200

用例

# 输入
4
1 1 0 0
1 1 1 0
0 1 1 0
0 0 0 1

# 输出
3

# 说明
Debian(1)和Unbuntu(2)相关
Mint(3)和Ubuntu(2)相关，
EeulerOS(4)和另外三个都不相关，
所以存在两个发行版集，发行版集中发行版的数量分别是3和1，所以输出3。

n = int(input())
matrix = []
for _ in range(n):
    matrix.append(list(map(int, input().split())))

class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)

        if x_root != y_root:
            self.pre[y_root] = x_root


def solve():

    ufs = UnionFindSet(n)

    for i in range(n):
        for j in range(i+1, n):
            if matrix[i][j] == 1:
                ufs.join(i, j)

    ans = [0 for _ in range(n)]
    for i in range(n):
        ans[ufs.find(i)] += 1

    return max(ans)

print(solve())

（6）精准核酸检测

题目描述

为了达到新冠疫情精准防控的需要，为了避免全员核酸检测带来的浪费，需要精准圈定可能被感染的人群。

现在根据传染病流调以及大数据分析，得到了每个人之间在时间、空间上是否存在轨迹的交叉。

现在给定一组确诊人员编号(X1,X2,X3...Xn) 在所有人当中，找出哪些人需要进行核酸检测，输出需要进行核酸检测的人数。（注意:确诊病例自身不需要再做核酸检测)

需要进行核酸检测的人，是病毒传播链条上的所有人员，即有可能通过确诊病例所能传播到的所有人。

例如:A是确诊病例，A和B有接触、B和C有接触 C和D有接触，D和E有接触。那么B、C、D、E都是需要进行核酸检测的

输入描述

第一行为总人数N

第二行为确诊病例人员编号 (确证病例人员数量 < N) ，用逗号隔开

接下来N行，每一行有N个数字，用逗号隔开，其中第i行的第个j数字表名编号i是否与编号j接触过。0表示没有接触，1表示有接触

输出描述

输出需要做核酸检测的人数

补充说明

人员编号从0开始
0 < N < 100

示例1

输入：
5
1,2
1,1,0,1,0
1,1,0,0,0
0,0,1,0,1
1,0,0,1,0
0,0,1,0,1

输出
3

说明：
编号为1、2号的人员为确诊病例1号与0号有接触，0号与3号有接触，2号54号有接触。
所以，需要做核酸检测的人是0号、3号、4号,总计3人要进行核酸检测。

N = int(input())
people = list(map(int, input().split(",")))
matrix = []
for _ in range(N):
    matrix.append(list(map(int, input().split(","))))

class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y, flag):
        x_root = self.find(x)
        y_root = self.find(y)
        if flag[y_ro

【刷题2025】高级数据结构（并查集+优先队列+图论）

1.并查集

（1）基础理论

（2）字符串化繁为简

（3）服务器广播

（4）走梅花桩

（5）Linux 发行版的数量

（6）精准核酸检测

网站公告

今日签到

热门文章

最新发布