不增加


11

我想知道(有关此问题其他)如果下界进行以下测试问题已知:一个被提供给非负数的序列查询访问ε ∈ 0 1 ,与所述承诺,要么Σ ñ ķ = 1一个ķ = 1Σ ñ ķ = 1一个ķ1 - εana1ε(0,1)k=1nak=1k=1nak1ε

多少查询(查询)是充分必要对于(自适应)随机算法的两种情况之间进行区分,以概率至少2/3

我找到了以前的文章,给出了对和的近似问题的对数上限(),对于确定性算法,该问题的下限大致匹配;但找不到针对我正在考虑的特定问题的结果(尤其是随机算法)。n


编辑:按照下面的答案,我想我应该更清楚:在上面(特别是在渐近线的下界),是被视为无穷大的“主要”量,而ε是(任意小) 不变。nε


我猜你的意思是ķ=1个ñ一种ķ1个-ε
RB

确实-已修复。
Clement C.

好吧,我认为(没有或没有采样)就没有必要依赖。A“坏”的实例(对序列的)将是例如与所有的序列ķ的等于1 - εnak,除了一个(任意的,随机的)Ĵ使得一个Ĵ要么等于ε(第一序列中)和0(在第二)。如果没有Ωn查询,则无法将两个序列区分开...1εn1jajε0Ω(n
Clement

我想查询模型允许您选择为您查询一个ķ,这是正确的?ķ一种ķ
kodlu 2014年

是的(您可以选择要“披露”的任何点)。
Clement C.

Answers:


5

这是我可以显示的下限。我猜想对于固定的,右下限是Ω log n ,但是自然地我可能是错误的。ϵΩ(logn)

我将使用递减顺序(仅为方便起见)。基本机制是将序列分为个块。在个块有将要Ñ 元件(即,Σ Ñ = Ñ)。Liniini=n

在下文中,我们希望算法以概率成功,对于一些参数δ > 01δδ>0

第一下界:Ω(1ϵlog1δ)

个块具有n i = 2 i - 1个元素,因此L = lg n。我们将第i个块中所有元素的值设置为1 + X i/2 n i L ,其中X i01的变量。显然,该序列的总和为 α = L i = 1 1 + Xini=2i1L=lgni(1+Xi)/(2niL)Xi01 想象一下,选择概率为β的每个Xi1,否则为0。要估计α,我们需要可靠的β估计。在颗粒中,我们希望能够在基座区分β=1-4ε和,就是说,β=1

α=i=1L1+Xi2niL=12+12L(i=1LXi).
Xiβ10αββ=14ϵβ=1

现在,假设对这些随机变量中的进行采样,并令Z 1Z m为采样变量。设置ÿ = Σ 中号= 11 - X (注意,我们正在采取的总和补充变量),我们有μ = è [ ÿ ] = 1 - β 和切尔诺夫不平等告诉我们如果β = 1 - 4mZ1,,ZmY=i=1m(1Xi)μ=E[Y]=(1β)m,则 μ = 4 ε ,和失败的概率是 P [ ý 2 ε ] = P [ ý 1 - 1 / 2 μ ]EXP - μ 1 / 2 2 / 2 = exp ϵ m / 2 使这个数量小于β=14ϵμ=4ϵm

P[Y2ϵm]=P[Y(11/2)μ]exp(μ(1/2)2/2)=exp(ϵm/2).
,我们需要2δm2ϵln1δ

关键的观察结果是,切尔诺夫不等式是紧密的(必须小心,因为它不适用于所有参数,但在这种情况下是正确的),因此您不能做得更好(不超过常数)。

第二下限:Ω(logn/loglogn)

将第个块大小设置为n i = L i,其中L = Θ log n / log log n 是块数。在一个元件个块具有值α = 1 /大号 / Ñ 。因此,序列中值的总和为1ini=LiL=Θ(logn/loglogn)iαi=(1/L)/ni1

现在,我们可以决定选择任意一块,说第一个,并在其块中设置的所有值是α Ĵ - 1 = 大号α Ĵ(而非α Ĵ)。这将第j个区块的贡献从1 / L增加到1,并将序列的总质量增加到(几乎)2jαj1=Lαjαjj1/大号1个2

现在,非正式地,任何随机算法都必须检查每个块中的值。因此,它必须至少读取序列的值。大号

为了使上述论点更正式的,以概率,给出质量的原始序列1作为输入(我们称此为原始的输入)。否则,随机选择具有增加的值的块(修改后的输入)。显然,如果随机算法读取小于,比方说,大号/ 8项,它具有概率(大约)1 / 8,以检测一个修改的输入。这样,如果该算法读取少于L / 8项,则该算法失败的概率至少为 1 - p 7 /p=1个/21个大号/81个/8大号/8

1个-p7/8>7/16>1个/3。

PS我认为,通过更仔细地考虑参数,可以将第一个下限提高到Ω1个/ϵ2


这次真是万分感谢!我对第一个 lb 有一个小问题(尤其是可能的二次改进)。既然我们这里有一个单方面的承诺问题,这意味着该算法只要“看到”任何给出β < 1的证据的值,就可以得出结论而不必获取更准确的β估计值:那意味着1 / ε是用于该构造最佳的,因为基本上人们所期望的或者所有X 的为1,或至少一个ε分数不被?Ω1个/ϵβ<1个β1个/ϵX一世ϵ
ClementC。

是的 如果您只想区分1和1-epsilon,那么您当然不能提高下限...我正在考虑尝试区分其他范围... s
Sariel Har-Peled 2015年

4

下界

至少查询是必要区分这两种情况。Ω1个/ϵ

考虑序列由下式给出ε 2 ε 3 ε 4 ε ...,与Ñ选择为使得一个1 + + 一个Ñ = 1。特别是,我们可以利用Ñ 1 / 一种1个一种ñϵ2ϵ3ϵ4ϵñ一种1个++一种ñ=1个ñ1个/2ϵ

现在建立一个新的序列通过减去修改上述序列的单个元件ε。换句话说,一个' 1 = 一个1一个' 2 = 一个2,等等,不同的是一个' = 一个 - ε。请注意,一个' 1 + + 一个' ñ = 1 - ε一种1个一种ñϵ一种1个=一种1个一种2=一种2一种一世=一种一世-ϵ一种1个++一种ñ=1个-ϵ

多少个探头没有考虑到区分一个' 1... 一个' ñ?好吧,它们的区别仅在于一个元素(第i个元素),因此需要Ω n )个探针才能实现恒定的区分概率。现在回顾,Ñ 1 / 一种1个一种ñ一种1个一种ñ一世Ωñ ; 我们发现Ω1/ñ1个/2ϵ探针是必需的。Ω1个/ϵ

上限

Ølgñ/ϵ[lgñ+1个/ϵ2]

[01个]

[0,1]=[0,0.25ϵ/n](0.25ϵ/n,0.5ϵ/n](0.5ϵ/n,ϵ/n](ϵ/n,2ϵ/n](2ϵ/n,4ϵ/n](,1].

aiaiai[,u]i,jai,,aj[,u]O(lg(n/ϵ))

现在,我们将估算每个范围内的值之和。第一个范围将与所有其他范围分开处理:

  • [0,0.25ϵ/n)0m×0.25ϵ/nmmn0.25ϵ

  • δO(1/δ2)2×δ=0.25ϵ

0.25ϵ0.25ϵ0.5ϵ11ϵ


谢谢-这看起来很有趣(据我所知,这与上面的论文/讨论中使用的方法不同),并且我将对您的内容进行更深入的研究。不过,我正在寻找的约束,而不是一个上限较低-也就是说,有多少查询是必要的
Clement C.

(随着时间的流逝,尽管如此,我仍在授予“悬赏”答案-尽管如果仍然有下限,我仍在寻找下限的参考。)
Clement C.

2
@ClementC。,我根据您的要求添加了下限。
DW 2014年

ñε
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.