不增加

我想知道（有关此问题其他）如果下界进行以下测试问题已知：一个被提供给非负数的序列查询访问和，与所述承诺，要么或。 $a_n \geq \dots\geq a_1$ $\varepsilon \in (0,1)$ $\sum_{k=1}^n a_k = 1$ $\sum_{k=1}^n a_k \leq 1-\varepsilon$

多少查询（查询）是充分必要对于（自适应）随机算法的两种情况之间进行区分，以概率至少？ $2/3$

我找到了以前的文章，给出了对和的近似问题的对数上限（），对于确定性算法，该问题的下限大致匹配；但找不到针对我正在考虑的特定问题的结果（尤其是随机算法）。 $n$

编辑：按照下面的答案，我想我应该更清楚：在上面（特别是在渐近线的下界），是被视为无穷大的“主要”量，而是（任意小）不变。 $n$ $\varepsilon$

reference-request randomized-algorithms property-testing

— 克莱门特C.
source

我猜你的意思是

。

\sum_{k = 1}^{n} a_{k} \leq 1 - ε

$\sum_{k=1}^n a_k \leq 1-\varepsilon$

— RB

确实-已修复。

— Clement C.

好吧，我认为（没有或没有采样）就没有必要依赖

。A“坏”的实例（对序列的）将是例如与所有的序列

的等于

n

$n$

a_{k}

$a_k$

，除了一个（任意的，随机的）

使得

要么等于

（第一序列中）和

（在第二）。如果没有

查询，则无法将两个序列区分开...

\frac{1 - ε}{n - 1}

$\frac{1-\varepsilon}{n-1}$

j

$j$

a_{j}

$a_j$

ε

$\varepsilon$

0

$0$

Ω (n)

$\Omega(n)$

— Clement

我想查询模型允许您选择

为您查询

，这是正确的？

k

$k$

a_{k}

$a_k$

— kodlu 2014年

是的（您可以选择要“披露”的任何点）。

— Clement C.

Answers:

这是我可以显示的下限。我猜想对于固定的，右下限是，但是自然地我可能是错误的。 $\epsilon$ $\Omega( \log n)$

我将使用递减顺序（仅为方便起见）。基本机制是将序列分为个块。在个块有将要元件（即，）。 $L$ $i$ $n_i$ $\sum_i n_i = n$

在下文中，我们希望算法以概率成功，对于一些参数。 $\geq 1-\delta$ $\delta >0$

第一下界：。 $\displaystyle \Omega\left( \frac{1}{\epsilon} \log \frac{1}{\delta} \right)$

第个块具有元素，因此。我们将第个块中所有元素的值设置为，其中是或的变量。显然，该序列的总和为 $i$ $n_i = 2^{i-1}$ $L = \lg n$ $i$ $(1+X_i)/(2n_iL)$ $X_i$ $0$ $1$ 想象一下，选择概率为每个为，否则为。要估计，我们需要可靠的估计。在颗粒中，我们希望能够在基座区分和，就是说，。

α = \sum_{i = 1}^{L} \frac{1 + X_{i}}{2 n_{i} L} = \frac{1}{2} + \frac{1}{2 L} (\sum_{i = 1}^{L} X_{i}) .

$\alpha = \sum_{i=1}^L \frac{1+X_i}{2n_i L} = \frac{1}{2} + \frac{1}{2L}\left(\sum_{i=1}^L X_i \right).$

X_{i}

$X_i$

β

$\beta$

1

$1$

0

$0$

α

$\alpha$

β

$\beta$

β = 1 - 4 ϵ

$\beta = 1-4\epsilon$

β = 1

$\beta=1$

现在，假设对这些随机变量中的进行采样，并令为采样变量。设置（注意，我们正在采取的总和补充变量），我们有和切尔诺夫不平等告诉我们如果 $m$ $Z_1, \ldots, Z_m$ $Y = \sum_{i=1}^m (1-X_i)$ $\mu = E[Y] = (1-\beta) m$ ，则，和失败的概率是使这个数量小于 $\beta =1-4\epsilon$ $\mu = 4\epsilon m$

P [Y \leq 2 ϵ m] = P [Y \leq (1 - 1 / 2) μ] \leq \exp (- μ (1 / 2)^{2} / 2) = \exp (- ϵ m / 2) .

$P\left[ Y \leq 2\epsilon m \right] = P\left[ Y \leq (1-1/2) \mu \right] \leq \exp \left( -\mu (1/2)^2 / 2 \right) = \exp \left( -\epsilon m / 2 \right).$

，我们需要

δ

$\delta$

。

m \geq \frac{2}{ϵ} \ln \frac{1}{δ}

$\displaystyle m \geq \frac{2}{\epsilon} \ln \frac{1}{\delta}$

关键的观察结果是，切尔诺夫不等式是紧密的（必须小心，因为它不适用于所有参数，但在这种情况下是正确的），因此您不能做得更好（不超过常数）。

第二下限：。 $\Omega( \log n / \log \log n)$

将第个块大小设置为，其中是块数。在一个元件个块具有值。因此，序列中值的总和为。 $i$ $n_i = L^i$ $L = \Theta( \log n / \log \log n)$ $i$ $\alpha_i = \Bigl(1/L\Bigr)/n_i$ $1$

现在，我们可以决定选择任意一块，说第一个，并在其块中设置的所有值是（而非）。这将第个区块的贡献从增加到，并将序列的总质量增加到（几乎）。 $j$ $\alpha_{j-1} = L \alpha_j$ $\alpha_j$ $j$ $1/L$ $1$ $2$

现在，非正式地，任何随机算法都必须检查每个块中的值。因此，它必须至少读取序列的值。 $L$

为了使上述论点更正式的，以概率，给出质量的原始序列作为输入（我们称此为原始的输入）。否则，随机选择具有增加的值的块（修改后的输入）。显然，如果随机算法读取小于，比方说，项，它具有概率（大约），以检测一个修改的输入。这样，如果该算法读取少于项，则该算法失败的概率至少为 $p=1/2$ $1$ $L/8$ $1/8$ $L/8$

（ 1个 - p ） （ 7 / 8 ） > 7 / 16 > 1个 / 3。

$(1-p)(7/8) > 7/16 > 1/3.$

PS我认为，通过更仔细地考虑参数，可以将第一个下限提高到。 $\Omega(1/\epsilon^2)$

— 萨里尔·哈皮尔
source

这次真是万分感谢！我对第一个

lb 有一个小问题（尤其是可能的二次改进）。既然我们这里有一个单方面的承诺问题，这意味着该算法只要“看到”任何给出

证据的值，就可以得出结论而不必获取更准确的

估计值：那意味着

是用于该构造最佳的，因为基本上人们所期望的或者所有

的为1，或至少一个

分数不被？

Ω (1 / ϵ)

$\Omega(1/\epsilon)$

β < 1

$\beta < 1$

β

$\beta$

1 / ϵ

$1/\epsilon$

X_{i}

$X_i$

ϵ

$\epsilon$

— ClementC。

是的如果您只想区分1和1-epsilon，那么您当然不能提高下限...我正在考虑尝试区分其他范围... s

— Sariel Har-Peled 2015年

下界

至少查询是必要区分这两种情况。 $\Omega(1/\sqrt{\epsilon})$

考虑序列由下式给出，与选择为使得。特别是，我们可以利用 $a_1,\dots,a_n$ $\epsilon,2\epsilon,3\epsilon,4\epsilon,\dots$ $n$ $a_1+\dots+a_n = 1$ 。 $n \approx 1/\sqrt{2\epsilon}$

现在建立一个新的序列通过减去修改上述序列的单个元件。换句话说，，，等等，不同的是。请注意，。 $a'_1,\dots,a'_n$ $\epsilon$ $a'_1=a_1$ $a'_2=a_2$ $a'_i = a_i - \epsilon$ $a'_1 + \dots + a'_n = 1-\epsilon$

多少个探头没有考虑到区分从？好吧，它们的区别仅在于一个元素（第个元素），因此需要探针才能实现恒定的区分概率。现在回顾， $a_1,\dots,a_n$ $a'_1,\dots,a'_n$ $i$ $\Omega(n)$ ; 我们发现 $n \approx 1/\sqrt{2\epsilon}$ 探针是必需的。 $\Omega(1/\sqrt{\epsilon})$

上限

$O(\lg(n/\epsilon) [\lg n + 1 / \epsilon^2])$

$[0,1]$

[0, 1] = [0, 0.25 ϵ / n] \cup (0.25 ϵ / n, 0.5 ϵ / n] \cup (0.5 ϵ / n, ϵ / n] \cup (ϵ / n, 2 ϵ / n] \cup (2 ϵ / n, 4 ϵ / n] \cup \dots \cup (\dots, 1] .

$[0,1] = [0,0.25\epsilon/n] \cup (0.25\epsilon/n,0.5\epsilon/n] \cup (0.5\epsilon/n,\epsilon/n] \cup (\epsilon/n,2\epsilon/n] \cup (2\epsilon/n,4\epsilon/n] \cup \dots \cup (\ldots,1].$

$a_i$ $a_i$ $a_i$ $[\ell,u]$ $i,j$ $a_i,\dots,a_j \in [\ell,u]$ $O(\lg(n/\epsilon))$

现在，我们将估算每个范围内的值之和。第一个范围将与所有其他范围分开处理：

$[0,0.25\epsilon/n)$ $0$ $m \times 0.25\epsilon/n$ $m$ $m \le n$ $0.25 \epsilon$
$\delta$ $O(1/\delta^2)$ $2 \times$ $\delta = 0.25 \epsilon$

$0.25 \epsilon$ $0.25 \epsilon$ $\le 0.5 \epsilon$ $1$ $1-\epsilon$

— DW
source

谢谢-这看起来很有趣（据我所知，这与上面的论文/讨论中使用的方法不同），并且我将对您的内容进行更深入的研究。不过，我正在寻找的约束，而不是一个上限较低-也就是说，有多少查询是必要的。

— Clement C.

（随着时间的流逝，尽管如此，我仍在授予“悬赏”答案-尽管如果仍然有下限，我仍在寻找下限的参考。）

— Clement C.

@ClementC。，我根据您的要求添加了下限。

— DW 2014年

n

$n$

ε

$\varepsilon$