简介
做到第四题,感觉好难,复杂度O(log(m+n))不好做,觉得该二分,做了一个小时放弃了,感觉没大一大二那种一直做下去,几个小时都不放弃的精力了,也可能是天气太热…..索性看了看官方的题解,顿时感觉茅塞顿开,我就把那题解放到这来吧。原文链接
解决方案
为了解决这个问题,我们需要理解“中位数的作用是什么”。在统计中,中位数被用来:
将一个集合划分为两个长度相等的子集,其中一个子集中的元素总是大于另一个子集中的元素。
如果理解了中位数的划分作用,我们就很接近答案了。
首先,让我们在任一位置 将 A 划分成两个部分:
1 | left_A | right_A |
由于 A 中有 m 个元素, 所以我们有 m+1 种划分的方法(i=0∼m)。
我们知道:
len(left_A)=i,len(right_A)=m−i.
注意:当 i=0 时,left_A 为空集, 而当 i=m 时, right_A 为空集。
采用同样的方式,我们在任一位置 j 将 B 划分成两个部分:
1 | left_B | right_B |
将 left_A 和 left_B 放入一个集合,并将 rright_A 和 right_B 放入另一个集合。 再把这两个新的集合分别命名为 left_part 和 right_part:
1 | left_part | right_part |
如果我们可以确认:
1.len(left_part)=len(right_part)
2.max(left_part)≤min(right_part)
那么,我们已经将 {A,B} 中的所有元素划分为相同长度的两个部分,且其中一部分中的元素总是大于另一部分中的元素。那么:
median=max(left_part)+min(right_part) / 2
要确保这两个条件,我们只需要保证:
1.i+j=m−i+n−j(或:m−i+n−j+1) 如果 n≥m,只需要使 i=0∼m, j=(m+n+1)/2−i
2.B[j−1]≤A[i] 以及 A[i−1]≤B[j]
ps.1 为了简化分析,我假设 A[i−1],B[j−1],A[i],B[j]总是存在,哪怕出现 i=0,i=m,j=0,或是 j=n 这样的临界条件。 我将在最后讨论如何处理这些临界值。
ps.2 为什么 n≥m?由于0≤i≤m且 j=(m+n+1)/2−i,我必须确保 j 不是负数。如果 n<m,那么 j 将可能是负数,而这会造成错误的答案。
所以,我们需要做的是:
在 [0,m] 中搜索并找到目标对象 i,以使:
B[j−1]≤A[i] 且 A[i−1]≤B[j],其中 j=(m+n+1)/2−i
接着,我们可以按照以下步骤来进行二叉树搜索:
设 imin=0,imax=m, 然后开始在 [imin,imax] 中进行搜索。
令 i=(imin+imax)/2, j=(m+n+1)/2−i
现在我们有 len(left_part)=len(right_part)。 而且我们只会遇到三种情况:
B[j−1]≤A[i] 且 A[i−1]≤B[j]:
这意味着我们找到了目标对象 i,所以可以停止搜索。
B[j−1]>A[i]:
这意味着 A[i] 太小,我们必须调整 i 以使 B[j−1]≤A[i]。
我们可以增大 i 吗?
是的,因为当 i 被增大的时候,j 就会被减小。
因此 B[j−1] 会减小,而 A[i] 会增大,那么 B[j−1]≤A[i] 就可能被满足。
我们可以减小 i 吗?
不行,因为当 i 被减小的时候,j 就会被增大。
因此 B[j−1] 会增大,而 A[i] 会减小,那么 B[j−1]≤A[i] 就可能不满足。
所以我们必须增大 i。也就是说,我们必须将搜索范围调整为 [i+1,imax]。 因此,设imin=i+1并转到步骤 2。
A[i−1]>B[j]: 这意味着 A[i−1] 太大,我们必须减小 i 以使 A[i−1]≤B[j]。 也就是说,我们必须将搜索范围调整为 [imin,i−1]。
因此,设 imax=i−1,并转到步骤 2。
当找到目标对象 i 时,中位数为:
max(A[i−1],B[j−1]), 当 m+n 为奇数时
max(A[i−1],B[j−1])+min(A[i],B[j])/2, , 当 m+n为偶数时
现在,让我们来考虑这些临界值 i=0,i=m,j=0,j=n,此时 A[i−1],B[j−1],A[i],B[j] 可能不存在。 其实这种情况比你想象的要容易得多。
我们需要做的是确保 max(left_part)≤min(right_part)。 因此,如果 i 和 j 不是临界值(这意味着 A[i−1],B[j−1],A[i],B[j]全部存在), 那么我们必须同时检查 B[j−1]≤A[i] 以及 A[i−1]≤B[j] 是否成立。 但是如果 A[i−1],B[j−1],A[i],B[j] 中部分不存在,那么我们只需要检查这两个条件中的一个(或不需要检查)。 举个例子,如果 i=0,那么 A[i−1]不存在,我们就不需要检查 A[i−1]≤B[j] 是否成立。 所以,我们需要做的是:
在 [0,m] 中搜索并找到目标对象 i,以使:
(j=0 or i=m or B[j−1]≤A[i]) 或是 (i=0 or j=n or A[i−1]≤B[j]), 其中 j=(m+n+1)/2−i
在循环搜索中,我们只会遇到三种情况:
(j=0 or i=m or B[j−1]≤A[i])) 或是(i=0 or j=n or A[i−1]≤B[j])这意味着 i 是完美的,我们可以停止搜索。
j>0 and i<m and B[j−1]>A[i]这意味着 i 太小,我们必须增大它。
i>0 and j<n and A[i−1]>B[j]这意味着 i 太大,我们必须减小它。
1 | class Solution { |
复杂度分析
时间复杂度:O(log(min(m,n))),
首先,查找的区间是 [0,m]。 而该区间的长度在每次循环之后都会减少为原来的一半。 所以,我们只需要执行 log(m) 次循环。由于我们在每次循环中进行常量次数的操作,所以时间复杂度为 O(log(m))。 由于 m≤n,所以时间复杂度是 O(log(min(m,n)))。
空间复杂度:O(1), 我们只需要恒定的内存来存储 9 个局部变量, 所以空间复杂度为 O(1)。