随着尺寸增加,正态分布的密度


15

我要问的问题是:正态分布均值的1个标准差内的样本比例如何随着变量数量的增加而变化?

(几乎)所有人都知道,在一维正态分布中,可以在平均值的1个标准偏差内找到68%的样本。那么在2、3、4,...尺寸上呢?我知道它变少了……但是多少(精确地)呢?拥有一张显示1、2、3 ... 10尺寸以及1、2、3 ... 10 SD尺寸的数字的表格会很方便。谁能指出这样的桌子?

还有一点背景-我有一个传感器,可以提供多达128个通道的数据。每个通道都受到(独立)电噪声的影响。当我感觉到校准对象时,我可以对足够多的测量求平均值,并获得128个通道的平均值以及128个单独的标准偏差。

但是...就单个瞬时读数而言,数据的响应不像128个单个读数那样,而是像一个(最多)128维矢量量的单个读数一样。当然,这是处理我们获取的一些关键读数的最佳方法(通常是128个中的4-6个)。

我想了解一下此向量空间中的什么是“正常”变化以及什么是“离群值”。我确定我已经见过一张我所描述的表格,该表格适用于这种情况-有人可以指向一张吗?


请-我只能凭经验回答-我不理解大多数数学符号。
omatai 2011年

Answers:


19

让我们X=(X1,,Xd)N(0,I):每个Xi是正常的N(0,1)Xi是独立的-我想这就是你的意思更高的维度是什么。

| |时,您会说X在平均值的1 sd之内||X||<1(X与平均值之间的距离小于1)。现在||X||2=X12++Xd2χ2(d),从而发生这种情况的概率为P(ξ<1),其中ξχ2(d)。您可以在优质的卡方桌上找到这个...

以下是一些值:

dP(ξ<1)10.6820.3930.2040.09050.03760.01470.005280.001890.00056100.00017

而对于2 SD:

dP(ξ<4)10.9520.8630.7440.5950.4560.3270.2280.1490.089100.053

在R中可以获取这些值与像commads pchisq(1,df=1:10)pchisq(4,df=1:10)等等。

枢纽后书正如枢机主教在评论中指出的那样,人们可以估计这些概率的渐近行为。一个的CDF 的变量是 ˚F dX = P d / 2 X / 2 = γ d / 2 X / 2 χ2(d) 其中,γ小号ÿ=ÿ0小号-1ë-d不完全γ-function,和classicalyΓ小号=0小号-1ë-d

Fd(x)=P(d/2,x/2)=γ(d/2,x/2)Γ(d/2)
γ(s,y)=0yts1etdtγΓ(s)=0ts1etdt

是一个整数,通过重复显示零件整合该 P 小号ÿ = Ë - ý &Sigma; ķ = 小号ÿ ķs 这是泊松分布CDF的尾部。

P(s,y)=eyk=sykk!,

(非常感谢基数)现在这笔款项是由它的第一项为主:代表大s。我们可以应用此当d是偶数: Pξ<X=Pd/2X/21P(s,y)yss!eysd 对于大偶数d,使用斯特林公式倒数第二个等价。从这个公式我们可以看到,随着d的增加,渐近衰减非常快。

P(ξ<x)=P(d/2,x/2)1(d/2)!(x2)d/2ex/21πde12(dx)(xd)d21πe12xd12d,
dd

欢迎来到我们的猫王网站!好答案。(+1)
whuber

1
ξd

谢谢您的意见。我认为这个答案不会引起太多关注!的确,这是维数诅咒的一种好形式... @cardinal(3)当第一个参数变为无穷大,第二个参数固定时,我不知道不完全伽马函数的任何渐近等价形式不简单!可以进行大致的专业划分,我可能稍后再写。
猫王

2
dd=2ķž一世=X2一世-1个2+X2一世2 是一个 ËXp1个/2随机变量。所以X2=一世=1个ķž一世。但是之后X2 只是直到 ķ泊松过程的更新,速率为1/2。所以P(X2<1)=P(N1/2(0,1)k)=e1/2x=k2x/x!. The tail of the Poisson is dominated by the leading term, so P(X2<1)e1/22k/Γ(k+1) as d (Again: k=d/2).
cardinal

1
Part of the point of the foregoing comment is that we get an exact answer for all even d. Also, using Stirling's approximation, we get that P(X2<1)e1/22k/Γ(k+1)e(d1)/2d(d+1)/2/π.
cardinal
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.