我找不到参考,因此我将在此处草绘证明。
定理。令为实随机变量。令为常数。假设,对于支持下的所有和所有, 我们有X1,⋯,Xna1,⋯,an,b1,⋯,bni∈{1,⋯,n}(x1,⋯,xi−1)(X1,⋯,Xi−1)
- E[Xi|X1=x1,⋯,Xi−1=xi−1]≤0和
- P[Xi∈[ai,bi]]=1。
然后,对于所有,t≥0
P[∑i=1nXi≥t]≤exp(−2t2∑ni=1(bi−ai)2).
证明。定义。我们声称对于所有和,我们都有
假设和对于所有在支撑的Yi=∑ij=1Xj
∀i∈{1,⋯,n} ∀λ≥0 E[eλYi]≤e18λ2∑ij=1(bj−aj)2.(*)
iλE[eλYi]=E[eλYi−1⋅eλXi]=E[eλYi−1⋅E[eλXi∣∣Yi−1]].
μ(yi−1):=E[Xi|Yi−1=yi−1]≤0P[Xi∈[ai,bi]]=1yi−1Yi−1。(请注意,。)因此,根据
霍夫丁的引理,对于所有在和所有。由于,我们有,对于所有,
现在归纳得出上面的声明(*)。
Yi−1=X1+⋯+Xi−1E[eλXi∣∣Yi−1=yi−1]≤eλμ(yi−1)+18λ2(bi−ai)2
yi−1Yi−1λ∈Rμ(yi−1)≤0λ≥0E[eλYi]≤E[eλYi−1⋅e0+18λ2(bi−ai)2].
现在我们将马尔可夫不等式应用于并使用我们的声明(*)。对于所有,
最后,设置以最小化右手表达式并获得结果。eλYnt,λ>0
P[∑i=1nXi≥t]=P[Yn≥t]=P[eλYn≥eλt]≤E[eλYn]eλt≤e18λ2∑ni=1(bi−ai)2eλt.
λ=4t∑ni=1(bi−ai)2■
正如我在评论中提到的那样,此声明与Azuma不等式的“通常”声明之间的主要区别在于,需要而不是。前者提供了更大的灵活性,在某些情况下节省了2倍。Xi∈[ai,bi]Xi∈[−a,a]
注意,证明中的随机变量是超级市场。您可以通过设置a,设置和(其中),然后应用以上结果。YiY1,⋯,YnXi=Yi−Yi−1[ai,bi]=[−ci,ci]P[|Yi−Yi−1|≤ci]=1