考虑的总和


40

我一直在想这个问题。我觉得它突然发生有点奇怪。基本上,为什么我们只需要三个均匀的Zn就能平滑呢?为何平滑化如此迅速地进行?

Z2

2

Z3

3

(图像从John D. Cook的博客中无耻地被盗:http : //www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/

为什么不用四套制服?还是五个?要么...?


11
好吧,简单到容易就可以了,因为3个制服的总和在pf中有二次分段,一旦获得两个或更多制服,您的平均值就会达到峰值。二次峰是“平滑的” ...并且二次块之间的连接点是1和2,因此它不能以1.5扭结。还有其他方法可以得出相同的结论
Glen_b 2012年

Answers:


71

我们可以采取各种方法,其中某些方法对某些人似乎很直观,而对另一些人则不太直观。为了适应这种变化,此答案调查了几种这样的方法,涵盖了数学思想的主要划分-分析(无限和无限小),几何/拓扑(空间关系)和代数(符号操纵的形式模式)以及概率本身。最终得出的结论是将所有四种方法统一起来,证明这里有一个真正的问题需要回答,并确切说明问题所在。每种方法都以其自己的方式提供了对独立统一变量之和的概率分布函数形状的性质的更深入了解。


背景

统一分配[0,1]有几个基本的描述。当具有这样的分布时,X

  1. 的机会,在于可测量的集合只是度量(长度)[ 0 1 ],写入| [ 0 1 ] | XAA[0,1]|A[0,1]|

  2. 由此可见,累积分布函数(CDF)是

    FX(x)=Pr(Xx)=|(,x][0,1]|=|[0,min(x,1)]|={0x<0x0x11x>1.

    CDF

  3. 的概率密度函数(PDF),其是衍生物CDF的,是0 X 1˚F XX = 0否则。(在01处未定义。)fX(x)=10x1fX(x)=001

    PDF格式


特征函数的直觉(分析)

任何随机变量X特征函数(CF)是exp i t X 的期望值(其中i是虚数单位,i 2 = 1)。使用均匀分布的PDF,我们可以计算Xexp(itX)ii2=1

ϕX(t)=exp(itx)fX(x)dx=01exp(itx)dx=exp(itx)it|x=0x=1=exp(it)1it.

该CF是一(版本)傅立叶变换的PDF,。关于傅立叶变换的最基本定理是:ϕ(t)=f^(t)

  • 自变量的总和的CF 是它们CF 的乘积X+Y

  • 当原始PDF 是连续的,X为界,˚F可以从CF恢复φ由傅立叶密切相关的版本变换,fXfϕ

f(x)=ϕˇ(x)=12πexp(ixt)ϕ(t)dt.
  • 当是可微数时,其导数可以用整数符号计算:f

    f(x)=ddx12πexp(ixt)ϕ(t)dt=i2πtexp(ixt)ϕ(t)dt.

    为了使这一点定义明确,最后一个积分必须绝对收敛。那是,

    |texp(ixt)ϕ(t)|dt=|t||ϕ(t)|dt

    必须收敛到一个有限值。相反,当其收敛时,借助于这些反演公式,导数随处可见。

现在清楚地知道,对于统一变量之和,PDF的可区分性是多少:从第一个项目符号开始,iid变量之和的CF是其中一个变量的CF升至次方,这里等于。分子是有界的(由正弦波组成),而分母是。我们可以将这样的被乘数乘以 ,当时,它将仍然绝对收敛,而当时,将有条件地收敛。因此,重复应用第三个项目符号显示,均匀变量之和的PDF 将连续为Ñ EXP - 1 ñ /ñ ø Ñ小号小号< ñ - 1个小号= ñ - 1 ñ ñ - 2nnth(exp(it)1)n/(it)nO(tn)tss<n1s=n1nn2次可微,在大多数地方,它将是n1倍。

n = 10时的CF

蓝色阴影曲线是同等变量之和的CF实部绝对值的对数对数图。红色虚线是渐近线。其斜率为,表明PDF的可微数为倍。作为参考,灰色曲线绘制了形状相似的高斯函数(常规PDF)的CF的实部。n=1010 2 = 810102=8


概率直觉

令和为独立的随机变量,其中具有一致的分布。考虑一个狭窄的区间,将的机会分解为足够接近该区间的机会乘以恰好大小的机会假设足够接近,则将放置在此间隔中:X X [ 0 1 ] + d ] X + Ý + d ] ý X X + ÿ ÿYXX[0,1](t,t+dt]X+Y(t,t+dt]YXX+YY

fX+Y(t)dt=Pr(X+Y(t,t+dt])=Pr(X+Y(t,t+dt]|Y(t1,t+dt])Pr(Y(t1,t+dt])=Pr(X(tY,tY+dt]|Y(t1,t+dt])(FY(t+dt)FY(t1))=1dt(FY(t+dt)FY(t1)).

最终的相等性来自的PDF表达式。将两边除以d t并将极限值设为d t 0得出Xdtdt0

fX+Y(t)=FY(t)FY(t1).

换句话说,加入统一的变量X任何变量ý改变PDF ˚F ÿ到CDF求差˚F ý- ˚F Ý- 1 。因为PDF是CDF的派生,这意味着每次我们向Y添加一个独立的统一变量时,所得PDF的可比性是以前的一倍。[0,1]XYfYFY(t)FY(t1)Y

让我们从统一变量开始应用这种见解。原始PDF的01不可区分:在此处是不连续的。的PDF ý + X是不可微的,在01,或2,但它必须是在这些点连续的,因为它是PDF的积分的差ÿ。添加另一个独立变量均匀X 2:的PDF ÿ + X + X 2可微的在012Y01Y+X012YX2Y+X+X2 012但不一定在这些点上具有二阶导数。等等。3


几何直觉

在CDF 的总和的Ñ IID均匀个变量等于所述单元超立方体的体积[ 0 1 ] Ñ躺在半空间内X 1 + X 2 + + X Ñ。对于情况Ñ = 3个变量在此示出,用定在1 / 23 / 2,然后5 / 2tn[0,1]nx1+x2++xntn=3t1/23/25/2

3D立方体

0n前进时,超平面H nt x 1 + x 2 + + x n = tt = 0t = 1 t = n的顶点交叉。横截面的形状每次改变:在图中,它首先是一个三角形(2个单纯形),然后是一个六边形,然后又是一个三角形。 t0nHn(t):x1+x2++xn=tt=0t=1,,t=n2为什么PDF在这些值处没有急剧弯曲?t

要理解这一点,首先考虑较小值。在此,超平面ħ Ñ切断的ñ - 1单纯形。单纯形的所有n - 1个维都与t成正比,而其“面积”则与t n - 1成正比。稍后将对此派上用场。假设θ为“单位步长函数”,tHn(t)n1n1ttn1θ

θ(x)={0x<01x0.

如果不是由于超立方体的其他角的存在,则该缩放将无限期地继续。单项的面积图看起来像下面的实心蓝色曲线:在负值处为零,等于t n 1 /n 1 在正数处,可方便地写成θ t t n 1 /n 1 。它的阶n 2n1tn1/(n1)!θ(t)tn1/(n1)!n2从意义上说,阶的所有导数都存在并且是连续的,但是n - 2阶的左右导数存在但在原点上不一致。n3n2

(在该图所示的其他的曲线是(红色), 3 θ - 2 - 2 2 / 2 (金),和 - θ - 3 - 3 2 / 2 (黑色)及其在的情况下的作用。ñ3θ(t1)(t1)2/2!3θ(t2)(t2)2/2!θ(t3)(t3)2/2!,将在下面进一步讨论。)n=3

简单区域图

为了理解越过1时发生的情况,让我们详细研究n = 2的情况,其中所有几何都发生在一个平面中。我们可以将单位“立方体”(现在只是一个正方形)视为象限线性组合,如下所示:t1n=2

象限

第一象限以灰色显示在左下方面板中。的值1.5,则确定在所有五个面板中所示的对角线。CDF等于右图所示的黄色区域。黄色区域包括:t1.5

  1. 左下方面板中的三角形灰色区域,

  2. 减去左上方面板中的三角形绿色区域,

  3. 减去中下部面板中的三角形红色区域,

  4. 加上中间上方面板中的任何蓝色区域(但没有任何这样的区域,直到超过2为止也不会存在)。t2

面积中的每一个都是三角形的面积。第一种鳞片状ñ = 2,接下来的两个是零< 1和否则缩放等- 1 ñ = - 1 2,最后是用于零< 2台否则秤像t 2 n。此几何分析已确定CDF与θ 2n=4tn=t2t<1(t1)n=(t1)2t<2(t2)n = θ 2 - 2 θ - 1 -θ(t)t2θ(t1)(t1)2θ(t1)(t1)2+θ(t2)(t2)2 ; 等价地,PDF是正比于三个函数的总和 θ - 2 θ - 1 - 1 ,以及 θ - 2 - 2 (他们每个缩放的当 n =线性θ(t)t22θ(t1)(t1)2+θ(t2)(t2)2θ(t)t2θ(t1)(t1)θ(t2)(t2))。的该图中示出了它们的图中的左侧面板:显然,它们是原始图形的所有版本 θ ,但(a)将偏移 0 1,和 2个单位通过重新缩放权和(b) 12 1n=2θ(t)t012121

n = 2的图形

右面板显示了这些图的总和(实心黑色曲线,已标准化为具有单位面积:这恰好是原始问题中所示的具有角度的PDF。

现在,我们可以了解任何iid统一变量之和在PDF中“扭结”的性质。 它们都是完全一样发生在“扭结” 中的函数θ ñ - 1,可能重新缩放,并且转移到整数1 2 ... Ñ相应于超平面ħ Ñ穿过超立方体的顶点。对于n = 2,这是方向上的可见变化:θ t 的右导数0θ(t)tn11,2,,nHn(t)n=2 0处 0,而其左导数为 1。对于 n = 3,这是方向的连续变化,但是二阶导数是突然的(不连续)变化。对于一般 Ñ,会有通过顺序连续衍生物 ñ - 2,但在不连续 Ñ - 1个ST衍生物。θ(t)t001n=3nn2n1st


代数运算的直觉

计算CF的积分,概率分析中条件概率的形式以及作为象限的线性组合的超立方体的综合都暗示着要恢复到原始的均匀分布,并将其重新表达为简单事物的线性组合。确实,其PDF可以编写

fX(x)=θ(x)θ(x1).

Δf

(Δf)(x)=f(x1).

X

fX=(1Δ)θ.

nfXnfg

(fg)(x)=f(xy)g(y)dy.

Δyy+1

(f(Δg))=f(xy)(Δg)(y)dy=f(xy)g(y1)dy=f((x1)y)g(y)dy=(Δ(fg))(x).

n

f=fXn=((1Δ)θ)n=(1Δ)nθn

nθn

θn(x)=θ(x)xn1n1!.

剩下的就是代数,因为二项式定理适用(就像实数上任何可交换代数一样):

f=(1Δ)nθn=i=0n(1)i(ni)Δiθn.

Δiifθ(x)xn1

f(x)=1(n1)!i=0n(1)i(ni)(xi)n1θ(xi).

(xi)+n1(xi)n1θ(xi)

xn1θ(x)01,2,,nn+1

n=8

n = 8的图


结束语

n

中心极限定理在这里无话可说。毕竟,iid 二项式变量的总和收敛于正态分布,但该总和始终是离散的:它甚至根本没有PDF!我们不希望对CLT的PDF的“纽带”或其他可区分性度量有任何直觉。


12
(+1)太棒了!现在,您花了多长时间将所有这些放在一起?
主教

13
@Cardinal这是我上周一失去权力之前读的最后一个问题。在随后的一周中,漫长而黑暗的夜晚为您提供了通过:-)进行思考的机会,并为娱乐目的提供了多个答案。上周末恢复供电后,只需花费一些时间来制作插图并将其全部写下(我承认,这花了比预期更长的时间)。我希望该线程中的某些内容可以作为将来有关随机变量总和的相关问题的参考。
ub

1
哇。我希望我可以“喜欢”这个答案
Rhubbarb 2012年

2
哇,这绝对是惊人的。我从未意识到如此简单的问题有多深。我要花点时间来理解你的答案,但是现在,非常感谢!
四字神名

6
我将在评论中违反SE政策,说我们(所有crossvalidate.com)应贿赂您的电力公司以更频繁地切断电力:)
mpiktas

1

您可能会说统一随机变量的概率密度函数是有限的,

因此它的积分是统一随机变量的累积密度函数,是连续的,

因此,两个统一随机变量之和的概率密度函数是连续的,

因此它的积分是两个均匀随机变量之和的累积密度函数,是平滑的(连续可微),

因此,三个统一随机变量之和的概率密度函数是平滑的。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.