用两个递归调用解决递归关系

我正在研究quicksort的最坏情况下的运行时，条件是它不会为very的各种定义进行非常不平衡的分区。

为了做到这一点，我问自己一个问题如果快速排序总是发生在分区的情况下那么运行时间将是什么，使得元素在左分区中，而在右分区中（在中间保留元素，即枢轴）。 $T(n, p)$ $0 < p \leq {1\over 2}$ $\lfloor{p(n-1)}\rfloor$ $\lceil(1 - p)(n - 1)\rceil$ $1$

不难看出，为最坏的情况给出了上限，在最坏的情况下，是允许的最大不平衡分区，因为任何分数分区都将更加平衡，运行时更短，并且不允许任何分数。 $T(n, p)$ $p$ $> p$ $<p$

很明显，在快速排序中是最好的情况，而是最差的情况。两者都具有在任何教育资源中都能找到的容易复发的关系。但是我不知道一般如何学习。明显的关系是： $T(n, {1 \over 2})$ $T(n, 0)$ $T(n, p)$

T (n, p) = n + T (⌊ p (n - 1) ⌋, p) + T (⌈ (1 - p) (n - 1) ⌉, p)

$T(n, p) = n + T(\lfloor{p(n-1)}\rfloor, p) + T(\lceil(1 - p)(n - 1)\rceil, p)$

在这里我被卡住了。我尝试过搜索，但是我能理解的有关分而治之算法的所有文献都按字面意义进行了“除法”，并利用分区总是相等的事实“欺骗”了分析，将术语合并为一个不变。

我不知道如何处理两个递归调用，也不知道删除舍入是否安全。这可以解析地解决吗？如果可以，怎么解决？

PS：我对渐近不感兴趣（对于任何常数，它很容易显示）。我对随着变小而使quicksort变慢多少感兴趣，例如，我对的比率感兴趣。 $\Theta(n \log n)$ $p$ $p$ $T(n, 0.25) \over T(n, 0.5)$

PPS：作为一名本科生，如果我发现明显的事情过于冗长或无法解释的琐事，我深表歉意。而且，尽管我不知道是否像其他SE网站一样受到人们的关注，但我会注意到这是个人兴趣，而不是作业。

algorithm-analysis runtime-analysis recurrence-relation

— 奥尔普
source

如您所述，Akra–Bazzi定理表明，对于所有递归都是。但是，这并没有揭示对的依赖的性质。为了确定后者，我们可以使用递归树方法。 $T(n,p)$ $O(n\log n)$ $p \in (0,1)$ $p$

递归树的根是间隔。它的两个子元素是间隔和，它们的总长度再次为。这些节点中的每个节点都有两个子节点（假设足够大），依此类推。为了简单起见，我们忽略了舍入误差，也就是说，我们假设是一个整数。这只是技术问题，我不会为此担心。只要节点的长度最大为我们就会停止该过程。算法的复杂度与树中间隔的总长度成正比。当，叶子 $\{1,\ldots n\}$ $\{1,\ldots,pn\}$ $\{pn+1,\ldots,n\}$ $n$ $n$ $pn$ $1$ $p \neq 1/2$ （停止过程的节点）的深度不同，这使得确定整体复杂性变得更加困难。

通过注意到树最多具有级别，我们可以获得一个简单的上限：每个节点至少比其父节点小倍。就像在分析，间隔中的任何级别的总长度为至多，我们获得上界的上运行时间。由于和对于小，我们可以写成。 $\log_{1-p} (1/n)$ $1-p$ $p = 1/2$ $n$ $O(n\log_{1-p} (1/n))$ $\log_{1-p} (1/n) = \log n/\log (1-p)^{-1}$ $\log (1-p)^{-1} = -\log (1-p) = p \pm O(p^2)$ $p$ $O(n\log n/p)$

这是一个更准确的计算。考虑等级。假设我们在达到很小的间隔时就不会停止该过程。我们可以通过采取步来生成随机顶点，在每个步中，我们以概率左（说），以概率右（说）。每次我们向左走时，间隔长度的对数减少，而每次我们向右走时，它的间隔减少。顶点在实际log的树中，其长度最多减少。级别上间隔的总权重 $t$ $t$ $p$ $1-p$ $-\log p$ $-\log (1-p)$ $\log n$ $t$ 树的精确度恰好是根据此过程生成的顶点对应于最多减少的概率。即，如果是其等于分配的概率为，并的概率为，和是独立的，则级别总权重为。对于超常数，随机变量大致呈正态分布，均值且方差为线性 $\log n$ $D$ $-\log p$ $p$ $-\log(1-p)$ $1-p$ $X_1,\ldots,X_t \sim D$ $t$ $\Pr[X_1+\cdots+X_t \leq \log n]$ $t$ $X_1+\cdots+X_t$ $[-p\log p-(1-p)\log(1-p)]t$ $t$ ，因此对于满足来说，概率将非常接近，而对于满足，也就是说，它将非常接近零。定义（称为二进制熵函数），我们得出结论，运行时间为（统一形式，如）。当我们有，因此我们之前的估计并不严格。 $t$ $[-p\log p-(1-p)\log(1-p)]t \leq (\log n)/2$ $1$ $t$ $[-p\log p-(1-p)\log(1-p)]t \geq 2\log n$ $h(p) = -p\log p-(1-p)\log(1-p)$ $\Theta(n\log n/h(p))$ $p$ $n\to\infty$ $p\to 0$ $h(p) \approx -p\log p$

查看同一分析的另一种方法是，像以前一样，使无限随机变量无限，并将停止时间定义为第一次这样。然后，运行时间与成正比。然后，基本更新定理指出，这意味着间隔的总大小等于。更准确地说，对于每个常数，间隔的总大小为，其中 $X_1,X_2,\ldots$ $T$ $t$ $X_1 + \cdots + X_t \geq \log n$ $n\mathbb{E}[T]$ $\lim_{n\to\infty} \mathbb{E}[T]/\log n = 1/\mathbb{E}[D] = 1/h(p)$ $(1+o(1))n\log n/h(p)$ $p$ $(1+\alpha_p(n))n\log n/h(p)$ $\alpha_p(n) = o(n)$ 。基本更新定理的收敛性在时间参数（在本例中为中呈指数关系，因此在应为多项式，即。对于任何，的收敛也可能是均匀的。 $\log n$ $n$ $\alpha_p(n) = O(n^{-C_p})$ $p \in (\delta,1-\delta)$ $\delta > 0$

总而言之，递归树中间隔的总长度与运行时间成正比，每个形式如下：其中和取相同的底，而是一个函数，取决于并且随着趋于。 $p$

T (n, p) = (1 + o (1)) \frac{n \log n}{h (p)},

$T(n,p) = (1+o(1)) \frac{n\log n}{h(p)},$

\log n

$\log n$

h (p) = - p \log p - (1 - p) \log (1 - p)

$h(p) = -p\log p-(1-p)\log(1-p)$

o (1)

$o(1)$

p

$p$

0

$0$

n

$n$

此外，对于任何和任何，间隔的总长度的形式为其中且隐藏的大O常数仅取决于。特别是对于所有常数，收敛速度很快。 $\delta > 0$ $p \in (\delta,1-\delta)$

T (n, p) = (1 + O (n^{- C_{δ}})) \frac{n \log n}{h (p)},

$T(n,p) = (1+O(n^{-C_\delta})) \frac{n\log n}{h(p)},$

C_{δ} > 0

$C_\delta > 0$

δ

$\delta$

p_{1}, p_{2}

$p_1,p_2$

lim_{n \to \infty} \frac{T (n, p_{1})}{T (n, p_{2})} = \frac{h (p_{2})}{h (p_{1})},

$\lim_{n\to\infty} \frac{T(n,p_1)}{T(n,p_2)} = \frac{h(p_2)}{h(p_1)},$

— Yuval Filmus
source

感谢您的快速回答Yuval。我对摘要中使用感到困惑。是一个常数，并不表示在下它是不相关的吗？我决定编写一个小测试程序，该程序显示，对于将分析方法与计算方法之间的进行比较，得出的误差为0.03。这似乎很大，还是可以预期？

Θ

$\Theta$

h (p)

$h(p)$

Θ

$\Theta$

n = 100000000000000

$n = 100000000000000$

T (n, 0.1) / T (n, 0.5)

$T(n, 0.1) / T(n, 0.5)$

— orlp

的常数在是均匀的。更准确地说，对于某些常数，情况是每个存在，从而对于，。对于每个固定的，您可能都可以得到形式更强的语句，其中o相对于（但可能取决于）; 应该不依赖于。

Θ

$\Theta$

p

$p$

c, C

$c, C$

p

$p$

N_{p}

$N_p$

n \geq N_{p}

$n\geq N_p$

c n \log n / h (p) \leq T (n, p) \leq C n \log n / h (p)

$cn\log n/h(p) \leq T(n, p) \leq Cn\log n/h(p)$

T (n, p) = (1 + o (1)) C n \log n / h (p)

$T(n, p)=(1+o(1))Cn\log n/h(p)$

p

$p$

n

$n$

p

$p$

C

$C$

p

$p$

— Yuval Filmus 2014年

收敛到极限取决于，因此您可能需要较大才能获得非常好的近似值。另一方面，0.03的相对误差听起来并不那么大。您可以尝试修复并将运行时间绘制为的函数，并将其与进行比较。

\log n

$\log n$

\log n

$\log n$

n

$n$

p

$p$

1 / h (p)

$1/h(p)$

— Yuval Filmus 2014年

抱歉，我的意思不是相对误差0.03，而是绝对误差（2.13222与2.10339）。将绘制为的函数，相对于的相对差为4％，其中是 96％。

T (n, p)

$T(n, p)$

p

$p$

1 / h (p)

$1 / h(p)$

T (10^{11}, 0.05) * h (0.05)

$T(10^{11}, 0.05) * h(0.05)$

T (10^{11}, 0.4) * h (0.4)

$T(10^{11}, 0.4) * h(0.4)$

— orlp 2014年

超常数是相对于相关变量（在本例中为）趋于无穷大的函数。与。

n

$n$

ω (1)

$\omega(1)$

— Yuval Filmus 2014年