在CLT中,为什么?


10

令是来自均值和方差的分布的独立观测值,当,则X1,...,Xnμσ2<n

nX¯nμσN(0,1).

为什么这意味着

X¯nN(μ,σ2n)?

也许下面没有足够清楚地强调这一点,但是语句在数学上有意义,而语句在数学上是荒谬的,因此,俗话说,甚至没有错
nX¯nμσN(0,1)
X¯nN(μ,σ2n)
难道

Answers:


17

您的解释有些不正确。中心极限定理(CLT)意味着

X¯napproxN(μ,σ2n).

这是因为CLT是渐近结果,并且我们实际上只处理有限样本。但是,当样本量足够大时,我们假设CLT结果近似成立,因此

nX¯nμσapproxN(0,1)nX¯nμσ.σnapproxσnN(0,1)X¯nμapproxN(0,σ2n)X¯nμ+μapproxμ+N(0,σ2n)X¯napproxN(μ,σ2n).

这是因为对于随机变量和常数,(在第二步中使用)和,(在倒数第二个步骤中使用)。Xa,bVar(aX)=a2Var(X)E(b+X)=b+E(X)Var(b+X)=Var(X)

阅读此内容以获取有关代数的更多解释。


从的LHS 到RHS 的用语时,您能否阐明使用的是“代数” ?
mavavilj

我已经弄清了代数。大部分使用方差和期望属性。
Greenparker

为什么不EG的第二项成为?N(μ,σ2n)N(μ,μ+σ2n)
mavavilj

3
因为。直观地,将一个常数添加到随机变量不会改变其方差。Var(aX+b)=a2Var(X)
Greenparker'3

10

最简单的方法是查看随机变量的均值和方差。X¯n

因此,表示平均值为零,方差为1。因此,我们的意思是:N(0,1)

E[nX¯nμσ]0
使用,其中是常数,我们得到: E[ax+b]=aE[x]+ba,b
X¯nμ

现在,使用,其中为常量,我们得到以下为方差:Var[ax+b]=a2Var[x]=a2σx2a,b

Var[nX¯nμσ]1
Var[X¯n]σ2n

现在,我们知道的均值和方差,具有这些均值和方差的高斯分布(正态分布)为X¯nN(μ,σ2n)

您可能想知道为什么要遍历所有这些代数?为什么不直接证明收敛到呢?X¯nN(μ,σ2n)

原因是在数学中很难(不可能?)证明收敛于变化的事物,即收敛运算符的右边必须固定,以便数学家使用他们的技巧来证明陈述。所述的表达与变化,这是一个问题。因此,数学家以这样的方式变换表达式,即右手边是固定的,例如是一个很好的固定右手边。N(μ,σ2n)nN(0,1)


4

除了作为近似值,它并不暗示的正态性。但是如果假装完全是标准正态,那么我们得到的结果是正态当 normal。一种查看方式是通过力矩生成函数X¯nn(X¯nμ)/στZ+μ(μ,τ2)Z(0,1)

MτZ+μ(t)=MZ(τt)Mμ(t)=et2τ2/2etμ=et2τ2/2+tμ

这是正常的 mgf(μ,τ2)


为什么矩生成函数可以证明它的分布呢?
mavavilj

1
这是概率的结果。如果两个随机变量具有相同的矩生成函数,则它们的分布相等。
dsaxton
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.