如果随机变量的值范围是有界的,我们如何获得正态分布为?


12

假设我们有一个随机变量,其值的范围由和界定,其中是最小值,是最大值。b a babab

有人告诉我,,其中是我们的样本大小,我们样本均值的抽样分布正态分布。也就是说,当我们增加我们越来越接近正态分布,但实际极限是相等的正态分布。ñ ñ ñ →交通nnnn

但是,它不是必须从扩展到的正态分布的定义的一部分吗?

如果我们范围的最大值为,则最大样本均值(与样本大小无关)将等于,最小样本均值将等于。b bba

因此在我看来,即使当接近无穷大时采用极限,我们的分布也不是实际的正态分布,因为它受和。一个bnab

我想念什么?

Answers:


15

这就是你所缺少的。渐近分布不是(样本均值),而是,其中是的均值。X¯nθXn(X¯nθ)θX

令是同义随机变量,和具有均值和方差。因此获得了有限的支持。CLT表示 一个< X < b X θ σ 2 X X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

其中是样本均值。现在X¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

如,下界和上界趋于和分别,因此作为的支撑就是整个实线。- ñ →交通nnn(X¯nθ)

在实践中,无论何时使用CLT,我们都说,这将始终是一个近似值。X¯nN(θ,σ2/n)


编辑:我认为部分困惑是由于对中心极限定理的误解。您认为样本均值的抽样分布

X¯nN(θ,σ2/n).

但是,采样分布是有限的采样属性。就像你说的,我们要让 ; 一旦执行,符号将是精确的结果。但是,如果我们让,我们将不能再在右边有(因为现在是)。因此,以下语句不正确nnnn

X¯ndN(θ,σ2/n) as n.

[这里代表分布的趋同]。我们想要准确地写下结果,所以不在右边。现在我们在这里使用随机变量的属性来获取dn

n(X¯nθ)dN(0,σ2)

要了解代数的工作原理,请看这里的答案。


谢谢。我了解您的不等式代数,但对于您的第一段我仍然有些困惑:“渐近分布不是(样本均值),而是 ...”。我以为CLT表示样本均值的抽样分布接近正态分布,如,我认为是RV,它接受大小为的样本的所有可能值。哪里从何而来?为什么我们对这种分布感兴趣而不对的分布感兴趣?X¯nn(X¯nθ)nX¯nnn(X¯nθ)X¯n
杰里米·拉德克里夫

(续)这是关于规范样本均值的分布吗?这是平方根的来源吗?与分数有关吗?Z
杰里米·拉德克里夫

@jeremyradcliff我已经编辑了答案,并提供了一个解释一些详细信息的链接。希望这现在更有意义。
Greenparker

1
非常感谢您抽出宝贵的时间进行编辑,您提供的链接正是我所需要的。你说得对,问题是,我遇到了麻烦核对抽样分布的有限性,而我们正在采取的事实到。n
杰里米·拉德克里夫

7

如果您指的是中心极限定理,请注意将其写出的一种正确方法是

(x¯μσ)ndN(0,1)

在正常条件下(是的平均值和标准偏差)。μ,σxi

使用这个正式定义,您可以立即看到,如果给定足够大的,则左侧可以在任何有限范围内取值。n

为了帮助连接到该“平均接近正态分布大型正规理念 ”,我们需要认识到,“接近正态分布”的意思是CDF的get任意接近一个正态分布变大。但是随着变大,该近似分布的标准偏差会缩小,因此近似正态的极端尾部的可能性也变为0。nnn

例如,假设。然后,您可以使用非正式近似来表示XiBern(p=0.5)

X¯˙N(p,p(1p)n)

因此,对于任何有限的,n

P(N(p,p(1p)n)<0)>0

(暗示近似值显然永远不会是完美的),如,n

P(N(p,p(1p)n)<0)0

因此,实际分布和近似分布之间的差异正在消失,这与近似值一样。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.