【每日一题】子数组最大异或和

发布于:2022-11-02 ⋅ 阅读:(550) ⋅ 点赞:(0)

数组异或和的定义:把数组中所有数异或起来得到的值。

给定一个整型数组:arr,其中可能有正、有负、有零,求其子数组的最大异或和

【举例】

arr = 【3】

数组中只有 1 个数,所以只有一个子数组,就是这个数组本身,最大异或和为 3

arr = 【3,-28,-29,2】

子数组有很多,但是【-28,-29】这个子数组的异或和为 7,是所有子数组中最大的。

分析:

异或和没有单调性。两个小的数的异或和可能比两个大数的异或和大。

解法一:暴力算法

对每一个以 i 为开始和以 j 为结尾的子数组,进行异或和计算,获取全局最大的异或和,就是答案。

时间复杂度: O ( N 3 ) O(N^3) O(N3)

时间复杂度:O(1)

import sys

def max_xor(arr):
    if not arr: return 0
    res = -sys.maxsize
    for i in range(len(arr)):
        for j in range(i, len(arr)):
             # 窗口:arr[i,j+1],计算窗口内数据的异或和
            xor = 0
            for k in range(i, j + 1):
                xor ^= arr[k]
            res = max(res, xor)
    return res

解法二:前缀异或和

前缀和的性质:

  1. 归零率:A ^ A = 0
  2. 恒等率:A ^ 0 = A

根据上述两个性质可以推导出:

C = A ⊕ B ⟹ C ⊕ A = A ⊕ B ⊕ A ⟹ C ⊕ A = B ⊕ 0 ⟹ A ⊕ C = B C = A \oplus B \Longrightarrow \\ C \oplus A = A \oplus B \oplus A \Longrightarrow \\ C \oplus A = B \oplus 0 \Longrightarrow \\ A \oplus C = B C=ABCA=ABACA=B0AC=B

根据前缀异或和可以计算出任意子数组的异或和。

在这里插入图片描述

时间复杂度: O ( N 2 ) O(N^2) O(N2)

时间复杂度:O(N)

def max_xor1(arr):
    if not arr: return 0

  	# 前缀异或和
    prefix_sum = [arr[0]]
    for i in range(1, len(arr)):
        prefix_sum.append(arr[i] ^ prefix_sum[-1])

    res = -sys.maxsize
    for i in range(len(arr)):
        s = 0 if i == 0 else prefix_sum[i - 1]
        for j in range(i, len(arr)):
            # 窗口:arr[i,j+1]
            xor = prefix_sum[j] ^ s
            res = max(res, xor)
    return res

解法三:前缀树 + 贪心

由解法二可知: C = A ⊕ B ⟹ B = C ⊕ A C = A \oplus B \Longrightarrow B = C \oplus A C=ABB=CA

即: a r r [ 2...5 ] = a r r [ 0...5 ] ⊕ a r r [ 0...2 ] arr[2...5] = arr[0...5] \oplus arr[0...2] arr[2...5]=arr[0...5]arr[0...2]

  • arr[0…5] 与 0 结合表示:arr[0…5] 子数组的异或和
  • arr[0…5] 与 arr[0] 结合表示:arr[1…5] 子数组的异或和
  • arr[0…5] 与 arr[0…1] 结合表示:arr[2…5] 子数组的异或和
  • arr[0…5] 与 arr[0…2] 结合表示:arr[3…5] 子数组的异或和

与谁结合异或和大,应对的子数组就是要找的子数组。

目前不知道 arr[0…5] 选择哪个?在解法二中是枚举尝试,我们现在想通过前缀树构建一种规则(贪心策略)来加速寻找最佳结合子数组。

在这里插入图片描述

贪心策略:在 arr[0…j] 选择 arr[ 0…i ] 结合过程中,优先迎合高位变成 1(高位为1,对应值更大)。

如下图:arr[0…j] 的异或和的二进制形式【0,1,1,0】,从高位A逐一匹配。由于 0 ^ 1 = 1,所以选择 1 的分支( A --> C ), 在 F 位置,虽然最期待走的路径是 0 ,但是没有 0 路径所以只能走 1 路径。整条路径【1,0,1,1】 就是 arr[0…j] (【0,1,1,0】)最佳结合的子数组对应的异或和。【0,1,1,0】^ 【1,0,1,1】= 【1,0,1,1】此时【1,0,1,1】 就是的返回结果 arr[0…j]。

在这里插入图片描述

前缀树

# 将所有的前缀异或和,加入到 NumTrie,并按照前缀树组织
class NumTrie:
    def __init__(self):
        self.root = Node()

    def add(self, num):
        cur = self.root
        # move 向右位移多少位
        for move in range(31, -1, -1):
            # 获取对应位上的数字(0 或者 1)
            path = (num >> move) & 1
            cur.nexts[path] = cur.nexts[path] if cur.nexts[path] else Node()
            cur = cur.nexts[path]

    # num 最希望遇到的路径,结果返回:最大的异或和
    # 时间复杂度:O(32)
    def max_xor(self, num):
        cur = self.root
        # 返回值(num ^ 最优选择)
        res = 0
        for move in range(31, -1, -1):
            # 获取对应位上的数字(0 或者 1)
            path = (num >> move) & 1
            # sum 该位的状态,最期待的路径(如果sum 位是0,期待path =1,否则 path = 0)
            # 注意:如果是符号位是 1(负数),期待 path = 1,异或后是 0(正数)
            #      如果是符号位是 0(正数),期待 path = 0,异或后是 0(正数)
            best = path if move == 31 else path ^ 1
            # 最期待走的路径  --> 实际路径
            best = best if cur.nexts[best] else best ^ 1
            # 注意:本代码是 python,左移 31 位不会变为负数,python 会将 int 转为 long 变为更大的数
            # 如果是 java:res |= (path ^ best) << move
            tmp = 1
            if move == 31 and num < 0:
                tmp = -1
            res |= tmp * (path ^ best) << move
            cur = cur.nexts[best]

        return res

时间复杂度: O ( N ) O(N) O(N)

时间复杂度:O(N)

def max_xor2(arr):
    if not arr: return 0
    res = -sys.maxsize

    trie = NumTrie()
    trie.add(0)
    # 一个数没有时,异或和为 0
    xor = 0
    for i in range(len(arr)):
        # xor 等于 0 ~ i 异或和
        xor ^= arr[i]
        # trie 装着所有:一个数也没有(0),0~1,0~2,0~3...0~i-1 的异或和
        res = max(res, trie.max_xor(xor))
        trie.add(xor)
    return res

对数器

import random

def check():
    max_value = 10
    for i in range(100):
        arr = [int(random.random() * max_value) - int(random.random() * max_value) for _ in
               range(int(random.random() * max_value))]
        res = max_xor(arr)
        res1 = max_xor1(arr)
        res2 = max_xor2(arr)
        if res != res1 or res != res2:
            print(i, "ERROR", arr, "res=", res, "res1=", res1, "res2=", res2)
    print("NICE")