是否存在切尔诺夫逆边界,该边界会限制尾部概率至少如此之大。
例如,如果是独立的二项式随机变量,并且。然后我们可以证明对于某些函数。X1,X2,…,Xn
是否存在切尔诺夫逆边界,该边界会限制尾部概率至少如此之大。
例如,如果是独立的二项式随机变量,并且。然后我们可以证明对于某些函数。X1,X2,…,Xn
Answers:
这是一个明确的证明,对于特定范围的参数,标准的Chernoff边界严格到指数的常数因子。(尤其是,只要变量是0或1,概率为1/2或小于1且ϵ∈(0,1/2)
如果发现错误,请告诉我。
引理1。(切尔诺夫界的紧度)
设X
(ⅰ)
如果每个rv为1的概率为至多p
(ii)
如果每个rv为1且概率至少为p
证明。 我们使用以下观察:
声明1.如果,则
1≤ℓ≤k−1
权利要求证明1.
通过斯特林近似,
其中i!=√2πi(i/e)ieλ
因此,,即 ,至少为
优质教育(kℓ)
引理1的证明(i)。
不失一般性假设在每个总和0/1随机变量
为1的概率为恰好。注意等于总和,并且。X
修复。总和中的项不断增加,因此索引为
值至少为,因此它们的总和的值至少为
。为了完成证明,我们证明
ℓ=⌊(1−2ϵ)pk⌋+1
假设和
给出,因此上方的左侧至少为。使用权利要求1来绑定,这至少是
,其中
而
ϵ2pk≥3
最后,我们显示和。A≥exp(−ϵ2pk)
索赔2. A≥exp(−ϵ2pk)
权利要求2
的证明。假设和
(i)。ϵ2pk≥3
根据定义,。通过(i),。因此,(ii)。ℓ≤pk+1
代的(ⅱ)的右手侧为在给出(ⅲ)。ℓ
假设,意味着,其中(iii)给出(iv)。ϵ2pk≥3
从得出(v)。ϵ2pk≥3
(iv)和(v)一起提出索赔。优质教育
声明3. 。B≥exp(−8ϵ2pk)
权利要求的证明3.
固定,使。
的选择意味着,因此该声明将一直存在,只要。将后一个不等式的两边取幂并简化,它等效于
替换并简化,它等效于
δ
ℓ
声明2和3暗示。这意味着引理的第(i)部分。AB≥exp(−ϵ2pk)exp(−8ϵ2pk)
引理1的证明(ii)。
在不失一般性的前提下,假设每个随机变量的概率为均为。1
注意。修复。Pr[X≥(1+ϵ)p]=∑ni=⌈(1−ϵ)pk⌉Pr[X=i/k]
总和中最后的项至少等于 ,至少等于。(证明与(i)相同,不同之处在于被替换
,被替换,使得。)ϵpk
的浆果Esseen定理可以给尾概率下限,只要它们比更高。n−1/2
您可以使用的另一个工具是Paley-Zygmund不等式。这意味着对于任何偶数以及任何实值随机变量,kX
Pr[|X|>=12(E[Xk])1/k]≥E[Xk]24E[X2k]
结合多项式定理,对于, rademacher随机变量之和Paley-Zygmund可以使您获得很强的下界。它也适用于有界独立随机变量。例如,您很容易得出 4方向独立随机变量的总和为且具有恒定的概率。Xnn±1Ω(√n)
如果您确实可以接受Bernoulli试验的有界和(而不是有界随机变量),那么以下内容就很严格了。
Slud的不平等*。 令是iid从具有的伯努利rv得出,并给出整数。如果(a)和或(b),则其中是标准法线的cdf。{Xi}ni=1E(X1)=pk≤np≤1/4np≤knp≤k≤n(1−p)Pr[∑iXi≥k]≥1−Φ(k−np√np(1−p)),
Φ
(将的参数视为转换标准法线,这完全与CLT告诉您的内容一致;实际上,它告诉我们,满足定理条件的二项式将在上尾部控制它们相应的高斯式。)Φ
从这里,您可以在上使用bounds 获得更好的东西。例如,在Feller的第一本书中,在关于高斯的部分中,对于每显示其中是标准法线的密度。在Wikipedia文章中,“ Q函数”也有类似的界限。Φz>0z1+z2φ(z)<1−Φ(z)<1zφ(z),
除此之外,以及其他人所说的,您也可以尝试直接使用二项式,也许与一些斯特灵一起使用。
(*)一些新的关于Slud不等式的陈述排除了其中一些情况;我已经在Slud的论文中转载了一篇。
广义Littlewood-Offord定理不是您想要的,但它通过显示随机变量的总和不太可能在任何特定值(包括期望)。也许会有用。
形式上,该定理如下。
广义Littlewood-Offord定理:令和为实数,使得为并令为独立的随机变量,其值为零和一。对于,假设对于所有,。然后,对于任何, 其中是一个常数,仅取决于。a1,…,ans>0|ai|≥s1≤i≤nX1,…,Xn0<p≤12p≤Pr[Xi=0]≤1−p1≤i≤nr∈RPr[r≤n∑i=1aiXi<r+s]≤cp√n
Wikipedia上所述的标准Chernoff界中的指数对于0/1值的随机变量是严格的。令,令为独立随机变量的序列,这样对于每个,和。然后对于每个, 0<p<1X1,X2,…iPr[Xi=1]=pPr[Xi=0]=1−pε>02−D(p+ε‖p)⋅nn+1≤Pr[n∑i=1Xi≥(p+ε)n]≤2−D(p+ε‖p)⋅n.
在这里,,这是伯努利随机数之间的Kullback-Leibler散度具有参数和变量。D(x‖y)=xlog2(x/y)+(1−x)log2((1−x)/(1−y))xy
如前所述,以上不等式的上限已在Wikipedia(https://en.wikipedia.org/wiki/Chernoff_bound)上以“ Chernoff-Hoeffding定理,加法形式”证明。下限可以使用“类型方法”来证明。参见[1]中的引理II.2。同样,在Cover和Thomas撰写的经典的信息论教科书中也有介绍。
[1] ImreCsiszár:类型方法。IEEE信息理论交易(1998年)。http://dx.doi.org/10.1109/18.720546