反向切尔诺夫界


31

是否存在切尔诺夫逆边界,该边界会限制尾部概率至少如此之大。

例如,如果是独立的二项式随机变量,并且。然后我们可以证明对于某些函数。X1,X2,,XnX1,X2,,Xnμ=E[ni=1Xi]μ=E[ni=1Xi]Pr[ni=1Xi(1+δ)μ]f(μ,δ,n)Pr[ni=1Xi(1+δ)μ]f(μ,δ,n)ff


1
您的示例要求太多:使用,标准的Chernoff边界显示和\ Pr [| T \ cap S_2 | \ sqrt {1.1} \ leq n ^ {1/3}]最多为\ exp(-cn ^ { 1/3})对于一些çp=n2/3Pr[|TS1|1.1n1/3]Pr[|TS1|1.1n1/3]Pr[|TS2|1.1n1/3]Pr[|TS2|1.1n1/3]exp(cn1/3)exp(cn1/3)cc
科林·麦奎伦

您是对的,我对切尔诺夫界中哪个词有平方感到困惑。我改变了这个问题以反映一个较弱的界限。我认为这不会对我当前的应用程序有所帮​​助,但是由于其他原因,这可能会很有趣。
Ashwinkumar BV 2012年

Answers:


28

这是一个明确的证明,对于特定范围的参数,标准的Chernoff边界严格到指数的常数因子。(尤其是,只要变量是0或1,概率为1/2或小于1且ϵ(0,1/2)ϵ(0,1/2),并且Chernoff上限小于一个常数。)

如果发现错误,请告诉我。

引理1。(切尔诺夫界的紧度) XXkk独立的,0/1个随机变量(rv)的平均值。对于任何ϵ(0,1/2]ϵ(0,1/2]p(0,1/2]p(0,1/2],假设ϵ2pk3ϵ2pk3

(ⅰ) 如果每个rv为1的概率为至多pp,然后 Pr[X(1ϵ)p]  exp(9ϵ2pk).

Pr[X(1ϵ)p]  exp(9ϵ2pk).

(ii) 如果每个rv为1且概率至少为pp,则 Pr[X(1+ϵ)p]  exp(9ϵ2pk).

Pr[X(1+ϵ)p]  exp(9ϵ2pk).

证明。 我们使用以下观察:

声明1.如果,则 1k11k1(k)  1e2π(k)(kk)k(k)  1e2π(k)(kk)k

权利要求证明1. 通过斯特林近似, 其中i!=2πi(i/e)ieλi!=2πi(i/e)ieλλ[1/(12i+1),1/12i].λ[1/(12i+1),1/12i].

因此,,即 ,至少为 优质教育(k)(k)k!!(k)!k!!(k)!2πk(ke)k2π(e)  2π(k)(ke)kexp(112k+1112112(k))

2πk(ke)k2π(e)  2π(k)(ke)kexp(112k+1112112(k))
  12π(k)(kk)ke1.
  12π(k)(kk)ke1.

引理1的证明(i)。 不失一般性假设在每个总和0/1随机变量 为1的概率为恰好。注意等于总和,并且。XX ppPr[X(1ϵ)p]Pr[X(1ϵ)p](1ϵ)pki=0Pr[X=i/k](1ϵ)pki=0Pr[X=i/k]Pr[X=i/k]=(ki)pi(1p)kiPr[X=i/k]=(ki)pi(1p)ki

修复。总和中的项不断增加,因此索引为 值至少为,因此它们的总和的值至少为 。为了完成证明,我们证明 =(12ϵ)pk+1=(12ϵ)pk+1iiPr[X=/k]Pr[X=/k](ϵpk2)Pr[X=/k](ϵpk2)Pr[X=/k](ϵpk2)Pr[X=/k]  exp(9ϵ2pk).

(ϵpk2)Pr[X=/k]  exp(9ϵ2pk).

假设和 给出,因此上方的左侧至少为。使用权利要求1来绑定,这至少是 ,其中 而 ϵ2pk3ϵ2pk3ϵ1/2ϵ1/2ϵpk6ϵpk623ϵpk(k)p(1p)k23ϵpk(k)p(1p)k(k)(k)ABABA=23eϵpk/2πA=23eϵpk/2πB=(k)(kk)kp(1p)k.B=(k)(kk)kp(1p)k.

最后,我们显示和。Aexp(ϵ2pk)Aexp(ϵ2pk)Bexp(8ϵ2pk)Bexp(8ϵ2pk)

索赔2. Aexp(ϵ2pk)Aexp(ϵ2pk)

权利要求2证明。假设和 (i)。ϵ2pk3ϵ2pk3ϵ1/2ϵ1/2pk12pk12

根据定义,。通过(i),。因此,(ii)。pk+1pk+1pk12pk121.1pk1.1pk

代的(ⅱ)的右手侧为在给出(ⅲ)。AAA23eϵpk/2.2πA23eϵpk/2.2π

假设,意味着,其中(iii)给出(iv)。ϵ2pk3ϵ2pk3ϵpk3ϵpk3A23e3/2.2π0.1A23e3/2.2π0.1

从得出(v)。ϵ2pk3ϵ2pk3exp(ϵ2pk)exp(3)0.04exp(ϵ2pk)exp(3)0.04

(iv)和(v)一起提出索赔。优质教育

声明3.Bexp(8ϵ2pk)Bexp(8ϵ2pk)

权利要求的证明3. 固定,使。 的选择意味着,因此该声明将一直存在,只要。将后一个不等式的两边取幂并简化,它等效于 替换并简化,它等效于 δδ=(1δ)pk=(1δ)pk
δ2ϵδ2ϵBexp(2δ2pk)Bexp(2δ2pk)1/1/pk(k(1p)k)k/1  exp(2δ2pk).

pk(k(1p)k)k/1  exp(2δ2pk).
=(1δ)pk=(1δ)pk(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
取双方的对数,并使用两次,它将保持 上面的左侧简化为,它小于因为。优质教育ln(1+z)zln(1+z)zδ+δp1p(1(1δ)p1)  2δ21δ.
δ+δp1p(1(1δ)p1)  2δ21δ.
δ2/(1p)(1δ)δ2/(1p)(1δ)2δ2/(1δ)2δ2/(1δ)p1/2p1/2

声明2和3暗示。这意味着引理的第(i)部分。ABexp(ϵ2pk)exp(8ϵ2pk)ABexp(ϵ2pk)exp(8ϵ2pk)

引理1的证明(ii)。 在不失一般性的前提下,假设每个随机变量的概率为均为。11pp

注意。修复。Pr[X(1+ϵ)p]=ni=(1ϵ)pkPr[X=i/k]Pr[X(1+ϵ)p]=ni=(1ϵ)pkPr[X=i/k]ˆ=(1+2ϵ)pk1^=(1+2ϵ)pk1

总和中最后的项至少等于 ,至少等于。(证明与(i)相同,不同之处在于被替换 ,被替换,使得。)ϵpkϵpk(ϵpk2)Pr[X=ˆ/k]exp(9ϵ2pk)ˆδˆδˆ=(1+ˆδ)pk


几个[数学处理错误]-是否有修复它们的机会?
Aryeh

这些数学表达式过去常常显示得很好。由于某些原因,\ choose命令在mathjax中不起作用。\ binom都不是。例如$ a \ choose b $给出。大概这是mathjax配置中的错误。希望它将尽快修复。同时,请参见arxiv.org/pdf/cs/0205046v2.pdf附录或cs.ucr.edu/~neal/Klein15Number中的引理5.2 。(ab)
Neal Young

22

浆果Esseen定理可以给尾概率下限,只要它们比更高。n1/2

您可以使用的另一个工具是Paley-Zygmund不等式。这意味着对于任何偶数以及任何实值随机变量,kX

Pr[|X|>=12(E[Xk])1/k]E[Xk]24E[X2k]

结合多项式定理,对于, rademacher随机变量之和Paley-Zygmund可以使您获得很强的下界。它也适用于有界独立随机变量。例如,您很容易得出 4方向独立随机变量的总和为且具有恒定的概率。Xnn±1Ω(n)


14

如果您确实可以接受Bernoulli试验的有界和(而不是有界随机变量),那么以下内容就很严格了。

Slud的不平等*。 令是iid从具有的伯努利rv得出,并给出整数。如果(a)和或(b),则其中是标准法线的cdf。{Xi}ni=1E(X1)=pknp1/4npknpkn(1p)Pr[iXik]1Φ(knpnp(1p)),

Φ

(将的参数视为转换标准法线,这完全与CLT告诉您的内容一致;实际上,它告诉我们,满足定理条件的二项式将在上尾部控制它们相应的高斯式。)Φ

从这里,您可以在上使用bounds 获得更好的东西。例如,在Feller的第一本书中,在关于高斯的部分中,对于每显示其中是标准法线的密度。在Wikipedia文章中,“ Q函数”也有类似的界限。Φz>0z1+z2φ(z)<1Φ(z)<1zφ(z),

φ

除此之外,以及其他人所说的,您也可以尝试直接使用二项式,也许与一些斯特灵一起使用。

(*)一些新的关于Slud不等式的陈述排除了其中一些情况;我已经在Slud的论文中转载了一篇。


7

de Moivre-Laplace定理表明,变量在适当地归一化并且在某些条件下,将在分布上收敛到正态分布。如果您想要恒定的下限,那就足够了。|TS1|

对于像这样的下界,您需要一个更好的工具。这是我所知道的一个参考(但只是偶然-我从来没有机会自己使用过这种不平等)。关于二项式分布的尾部概率的一些明确的下限在定理1.5 (BélaBollobás 的《随机图》,剑桥,第二版)中给出,其中进一步引用了Feller 的《概率论及其应用》和Rényi 的《概率基础》nc


4

广义Littlewood-Offord定理不是您想要的,但它通过显示随机变量的总和不太可能在任何特定值(包括期望)。也许会有用。

形式上,该定理如下。

广义Littlewood-Offord定理:令和为实数,使得为并令为独立的随机变量,其值为零和一。对于,假设对于所有,。然后,对于任何, 其中是一个常数,仅取决于。a1,,ans>0|ai|s1inX1,,Xn0<p12pPr[Xi=0]1p1inrRPr[rni=1aiXi<r+s]cpn

cpp

3
知道这种结果也被称为“小球不平等”,并且Nguyen和Vu的调查非常棒,对其他人可能会有帮助。math.osu.edu/ nguyen.1261 / cikk / LO-survey.pdf。我在这里的观点与您的观点略有不同。我认为“反向切尔诺夫”界对小球在0附近的概率质量给出较低的估计。我认为小球不等式定性地说,小球的概率由0处的球最大化。反向切尔诺夫边界通常比小球不等式更容易证明。
Sasho Nikolov

3

Wikipedia上所述的标准Chernoff界中的指数对于0/1值的随机变量是严格的。令,令为独立随机变量的序列,这样对于每个,和。然后对于每个, 0<p<1X1,X2,iPr[Xi=1]=pPr[Xi=0]=1pε>02D(p+εp)nn+1Pr[ni=1Xi(p+ε)n]2D(p+εp)n.

在这里,,这是伯努利随机数之间的Kullback-Leibler散度具有参数和变量。D(xy)=xlog2(x/y)+(1x)log2((1x)/(1y))xy

如前所述,以上不等式的上限已在Wikipedia(https://en.wikipedia.org/wiki/Chernoff_bound)上以“ Chernoff-Hoeffding定理,加法形式”证明。下限可以使​​用“类型方法”来证明。参见[1]中的引理II.2。同样,在Cover和Thomas撰写的经典的信息论教科书中也有介绍。

[1] ImreCsiszár:类型方法。IEEE信息理论交易(1998年)。http://dx.doi.org/10.1109/18.720546


还值得注意的是,对于常见的它是。这表明,当,典型的边界很明显。(当时)。D(p+δpp)=p22pδ2+O(δ3)p=1/212δ2+O(δ4)δ=O(n1/3)eCδ2δ=O(n1/4)p=1/2
托马斯·阿勒
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.