【刷题2025】高级数据结构(并查集+优先队列+图论)

发布于:2025-04-16 ⋅ 阅读:(21) ⋅ 点赞:(0)

1.并查集

(1)基础理论

并查集是一种树形的数据结构,用于处理一些不相交集合的 合并查询 问题。比如,可以用并查集判断一个森林中有几棵树、某个节点是否属于某棵树。

并查集由一个整形数组 pre[] 和两个函数 find() 、 join() 构成。

  • 数组 pre[] 记录了每个点的前驱结点
  • find(x) 函数用于查找指定节点x属于哪个集合
  • join(x,y) 函数用于合并两个节点x、y
# find函数,寻找最上层节点(代表元)
def find(x):				# 查找 x 最上层节点

	while(pre[x] != x):	    # 如果x的上层不是自己(则说明找到的人不是最上层节点)
		x = pre[x]			# x 继续找上层节点,直到找到最上层节点为止
	return x				# 返回最上层节点

# join函数,将两个节点合并到一棵树中
dfs join(x, y)                     # 将两个节点 x 和 y 合并到一棵树中

    fx, fy = find(x), find(y)      # 寻找 x, y 的代表元
    if(fx != fy)                   # 如果 x 和 y 的代表元不相等
        pre[fx]=fy                 # 则将 x 的代表元设置为 y

路径压缩算法 :将x到根节点路径上的所有点的pre(上级)都设为根节点

def find(x):               # 查找结点 x 的根结点 

    if pre[x] == x:
        return x		   # 递归出口:x 的代表元为 x 本身,即 x 为根结点
    pre[x] = find(pre[x])  # 找到 x 的上层节点,并将其上层节点更改为根节点
    return x	           # 将 x 到根节点路径上的所有节点的前驱结点更改为根节点 

路径压缩算法(加权标记法) :用权值大小决定谁做前驱结点

def union(x, y)

    x, y = find(x), find(y)	  # 寻找 x,y 的代表元

    if x==y:
        return 				  # 如果 x,y 的代表元一致,不需要合并,直接返回

    if rank[x]>rank[y]:       # 如果 x 的高度大于 y,则令 y 的上级为 x
        pre[y]=x		
    else:				      # 否则
        if rank[x]==rank[y]:
            rank[y]++	      # 如果 x 的高度和 y 的高度相同,则令 y 的高度加1
        pre[x]=y			  # 让 x 的上级为 y

 (2)字符串化繁为简

题目说明

给定一个输入字符串,字符串只可能由英文字母 ('a'~'z'、'A'~'Z' )和左右小括号 ('('、')')组成。当字符里存在小括号时,小括号是成对的,可以有一个或多个小括号对,小括号对不会嵌套,小括号对内可以包含1个或多个英文字母,也可以不包含英文字母。当小括号对内包含多个英文字母时,这些字母之间是相互等效的关系,而且等效关系可以在不同的小括号对之间传递,即当存在'a'和'b'等效和存在'b'和'c' 等效时,'a' 和 'c' 也等效,另外,同一个英文字母的大写字母和小写字母也相互等效 (即使它们分布在不同的括号对里)。
需要对这个输入字符串做简化,输出一个新的字符串,输出字符串里只需保留输入字符串里的没有被小括号对包含的字符(按照输入字符串里的字符顺序) ,并将每个字符替换为在小括号对里包含且字典序最小的等效字符。
如果简化后的字符串为空,请输出为"0"。
 
示例:
输入字符串为"never(dont)give(run)up(f)()",初始等效字符集合为('d','o','n','t')、('r','u','n'),由于等效关系可以传递,因此最终等效字符集合为('d','o','n','t','r','u'),将输入字符串里的剩余部分按字典序最小的等效字符替换后得到"devedgivedp"。

输入描述

input_string
输入为 1 行,代表输入字符串。

输出描述

output_string
输出为 1 行,代表输出字符串。

补充说明

输入字符串的长度在 1 ~ 100000 之间。

示例    
示例1    
输入    ()abd
输出    abd
说明    输入字符串里没有被小括号包含的子字符串为"abd",其中每个字符没有等效字符,输出为"abd"。
示例2    
输入    (abd)demand(fb)for
输出    aemanaaor
说明    等效字符集为('a','b','d','f'),输入字符串里没有被小括号包含的子字符串集合为 "demandfor",将其中字符替换为字典序最小的等效字符后输出为:"aemanaaor"。
示例3    
输入    ()happy(xyz)new(wxy)year(t)
输出    happwnewwear
说明    等效字符集为('x','y','z','w'),输入字符串里没有被小括号包含的子字符串集合为"happynewyear",将其中字符替换为字典序最小的等效字符后输出为:"happwnewwear"。
示例4    
输入    ()abcdefgAC(a)(Ab)(C)
输出    AAcdefgAC
说明    等效字符集为('a','A','b'),输入字符里没有被小括号包含的子字符串集合为"abcdefgAC",将其中字符替换为字典序最小的等效字符后输出为:"AAcdefgAC"。

# 这道题给我的启示就是虽然看错了题但是也能AC 75%
# 想开点吧孩子

s = input()

# 并查集实现
class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)

        # 保证字典序小的字符优先为根
        if x_root < y_root:
            self.pre[y_root] = x_root
        else:
            self.pre[x_root] = y_root


def solve():
    
    new_s = []  # 主体字符容器
    equal = []  # 等效字符容器
    ufs = UnionFindSet(128)  # 使用并查集记录等效传递关系, 数组索引对应 0~127 ASCII码值的字符
    letters = set()  # set记录已被加入到ufs的字母
    isOpen = False  # isOpen标志,表示有没有遇到 '(' 字符

    for c in s:
        if c == '(':
            isOpen = True  # 接下来将开始收集等效字符
        elif c == ')':
            isOpen = False  # 某个()内的等效字符收集完成

            if len(equal) == 0:
                continue

            # 括号间等效传递
            for letter in equal:
                # 不同括号间的大小写字母可以形成等效传递
                upper = letter - 32
                lower = letter + 32

                # set记录的是之前括号里面出现过的字母
                if lower in letters:
                    ufs.join(letter, lower)

                if upper in letters:
                    ufs.join(letter, upper)

            # 括号内等效传递
            cur_root = equal[0]
            for letter in equal:
                ufs.join(letter, cur_root)
                letters.add(letter)  # 将当前()内字符加入set

            # 清空eq, 用于收集下个()内的字母
            equal.clear()
            
        elif isOpen:
            equal.append(ord(c))  # 等效字符容器
        else:
            new_s.append(ord(c))  # 主体字符容器

    # 等效替换
    for i in range(128):
        root = ufs.find(i)  # 找到i字母的等效的字典序最小的字母root

        # 将i替换为root
        for j in range(len(new_s)):
            if new_s[j] == i:
                new_s[j] = root

    res = "".join(map(lambda x: chr(x), new_s))

    if len(res) == 0:
        return("0")  # 如果简化后的字符串为空,请输出为"0"
    else:
        return(res)


print(solve())

(3)服务器广播

题目描述
服务器连接方式包括直接相连,间接连接。

A和B直接连接,B和C直接连接,则A和C间接连接。

直接连接和间接连接都可以发送广播。

给出一个N*N数组,代表N个服务器,

matrix[i][j] == 1,
则代表i和j直接连接;不等于 1 时,代表i和j不直接连接。

matrix[i][i] == 1,

即自己和自己直接连接。matrix[i][j] == matrix[j][i]。

计算初始需要给几台服务器广播, 才可以使每个服务器都收到广播。

输入描述
输入为N行,每行有N个数字,为0或1,由空格分隔,

构成N*N的数组,N的范围为 1 <= N <= 40

输出描述
输出一个数字,为需要广播的服务器的数量

示例1

# 输入
1 0 0
0 1 0
0 0 1

# 输出
3

# 说明:3 台服务器互不连接,所以需要分别广播这 3 台服务器

示例2

# 输入
1 1
1 1

# 输出
1

# 说明:2 台服务器相互连接,所以只需要广播其中一台服务器

# 要在ufs的定义函数中做文章,self.pre可以不使用,也可以在init里定义其他需要用到的参数
# 本题中进行一次join操作相当于少了一个需要广播的计算机
# 因此对join函数进行改动

matrix = []
while True:
    try:
        matrix.append(list(map(int, input().split())))
    except:
        break

class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]
        self.count = n

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)

        if x_root != y_root:
            self.pre[y_root] = x_root
            self.count -= 1
        return

def solve():

    n = len(matrix)

    ufs = UnionFindSet(n)

    for i in range(n):
        for j in range(i, n):
            if matrix[i][j] == 1:
                ufs.join(i, j)

    return ufs.count

print(solve())

 (4)走梅花桩

题目描述

少林寺武僧有一项训练科目就是走梅花桩,现在有 m 行 n 列的梅花桩,每个梅花桩都有一个高度,若相邻梅花桩之间的高度相差为 x,则可以走到相邻梅花桩上。

少林武僧可以选择任意起始位置,请你计算出少林武僧最多可以走多少个梅花桩。

输入描述

第一行输入 m 和 n 和 x,以空格分隔。m 和 n 不大于100。高度差 x 不大于10。

之后 m 行,每行 n 个数,分别表示梅花桩的高度。高度不大于100。

输出描述

请输出少林武僧最多可以走的梅花桩数量。

用例

输入

5 5 1
1 2 3 4 5
9 8 7 6 5
9 9 9 9 9
1 2 3 4 5
1 2 3 4 5

输出

15
# 竟然会做了!惊喜!
m, n, x = list(map(int, input().split()))
matrix = []
for _ in range(m):
    matrix.append(list(map(int, input().split())))
# print(matrix)

class UnionFindSet:
    def __init__(self, m, n):
        self.pre = [i for i in range(m*n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)
        if x_root != y_root:
            self.pre[y_root] = x_root



def solve():

    ufs = UnionFindSet(m, n)

    dir = ((-1, 0), (0, -1), (1, 0), (0, 1))

    for i in range(m):
        for j in range(n):
            for d in dir:
                newi = i + d[0]
                newj = j + d[1]
                if 0 <= newi < m and 0 <= newj < n and abs(matrix[i][j] - matrix[newi][newj]) <= x:
                    ufs.join(n*i+j, n*newi+newj)

                else:
                    continue

    ans = [0 for _ in range(m*n)]
    for index in range(m*n):
        ans[ufs.find(index)] += 1

    return max(ans)

print(solve())

 (5)Linux 发行版的数量

题目描述
Linux操作系统有多个发行版,distrowatch.com提供了各个发行版的资料。这些发行版互相存在关联,例如Ubuntu基于Debian开发,而Mint又基于Ubuntu开发,那么我们认为Mint同Debian也存在关联。

发行版集是一个或多个相关存在关联的操作系统发行版,集合内不包含没有关联的发行版。

给你一个 n * n 的矩阵 isConnected,其中 isConnected[i][j] = 1 表示第 i 个发行版和第 j 个发行版直接关联,而 isConnected[i][j] = 0 表示二者不直接相连。

返回最大的发行版集中发行版的数量。

输入描述
第一行输入发行版的总数量N,

之后每行表示各发行版间是否直接相关

输出描述
输出最大的发行版集中发行版的数量

备注
1 ≤ N ≤ 200

用例

# 输入
4
1 1 0 0
1 1 1 0
0 1 1 0
0 0 0 1

# 输出
3

# 说明
Debian(1)和Unbuntu(2)相关
Mint(3)和Ubuntu(2)相关,
EeulerOS(4)和另外三个都不相关,
所以存在两个发行版集,发行版集中发行版的数量分别是3和1,所以输出3。
n = int(input())
matrix = []
for _ in range(n):
    matrix.append(list(map(int, input().split())))

class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y):
        x_root = self.find(x)
        y_root = self.find(y)

        if x_root != y_root:
            self.pre[y_root] = x_root


def solve():

    ufs = UnionFindSet(n)

    for i in range(n):
        for j in range(i+1, n):
            if matrix[i][j] == 1:
                ufs.join(i, j)

    ans = [0 for _ in range(n)]
    for i in range(n):
        ans[ufs.find(i)] += 1

    return max(ans)

print(solve())

(6)精准核酸检测

题目描述

为了达到新冠疫情精准防控的需要,为了避免全员核酸检测带来的浪费,需要精准圈定可能被感染的人群。

现在根据传染病流调以及大数据分析,得到了每个人之间在时间、空间上是否存在轨迹的交叉。

现在给定一组确诊人员编号(X1,X2,X3...Xn) 在所有人当中,找出哪些人需要进行核酸检测,输出需要进行核酸检测的人数。(注意:确诊病例自身不需要再做核酸检测)

需要进行核酸检测的人,是病毒传播链条上的所有人员,即有可能通过确诊病例所能传播到的所有人。

例如:A是确诊病例,A和B有接触、B和C有接触 C和D有接触,D和E有接触。那么B、C、D、E都是需要进行核酸检测的

输入描述

第一行为总人数N

第二行为确诊病例人员编号 (确证病例人员数量 < N) ,用逗号隔开

接下来N行,每一行有N个数字,用逗号隔开,其中第i行的第个j数字表名编号i是否与编号j接触过。0表示没有接触,1表示有接触

输出描述

输出需要做核酸检测的人数

补充说明

  • 人员编号从0开始
  • 0 < N < 100

示例1

输入:
5
1,2
1,1,0,1,0
1,1,0,0,0
0,0,1,0,1
1,0,0,1,0
0,0,1,0,1

输出
3

说明:
编号为1、2号的人员为确诊病例1号与0号有接触,0号与3号有接触,2号54号有接触。
所以,需要做核酸检测的人是0号、3号、4号,总计3人要进行核酸检测。
N = int(input())
people = list(map(int, input().split(",")))
matrix = []
for _ in range(N):
    matrix.append(list(map(int, input().split(","))))

class UnionFindSet:
    def __init__(self, n):
        self.pre = [i for i in range(n)]

    def find(self, x):
        if x != self.pre[x]:
            self.pre[x] = self.find(self.pre[x])
            return self.pre[x]
        return x

    def join(self, x, y, flag):
        x_root = self.find(x)
        y_root = self.find(y)
        if flag[y_ro