正态分布误差和中心极限定理


9

在Wooldridge的《计量经济学入门》一书中有一个报价:

证明误差的正态分布合理的参数通常是这样的:由于是影响的许多不同的未观察因素的总和,因此我们可以调用中心极限定理来得出具有近似正态分布的结论。uyu

此引用与线性模型假设之一有关,即:

uN(μ,σ2)

其中u是总体模型中的误差项。

现在,据我所知,中心极限定理指出

Zi=(Yi¯μ)/(σ/n)

(其中Yi¯ 是从任何具有均值μ和方差σ^ 2的总体中抽取的随机样本的平均值σ2

接近标准正态变量的n

题:

帮助我了解Z_i的渐近正态性如何Zi暗示uN(μ,σ2)

Answers:


13

通过用同态随机变量之和表示CLT的结果,可以更好地理解这一点。我们有

nX¯μσN(0,1)asymptotically

将商乘以然后使用的事实来获得σnVar(cX)=c2Var(X)

X¯μN(0,σ2n)

现在将添加到LHS并使用的事实来获得μE[aX+μ]=aE[X]+μ

X¯=1ni=1nXiN(μ,σ2n)

最后,乘以并使用上面的两个结果可以看到n

i=1nXiN(nμ,nσ2)

这与Wooldridge的陈述有什么关系?好吧,如果误差是许多iid随机变量总和,那么它将大致呈正态分布,如刚刚看到的那样。但是这里存在一个问题,即未观察到的因素不一定会完全相同地分布,甚至可能不是独立的!

但是,在某些其他规则性条件下,CLT已成功扩展到独立的不相同分布的随机变量,甚至轻微依赖的情况。这些本质上是确保总和中的任何一项都不会对渐近分布产生不成比例影响的条件,另请参阅CLT上的Wikipedia页面。您当然不需要知道这些结果。Wooldridge的目的仅仅是提供直觉。

希望这可以帮助。


我要补充一点(因为作者研究了计量经济学),在他的研究领域中,许多随机变量(至少是用于建模的变量)没有定义第一时刻,例如柯西分布。因此,CLT不是您可以依靠的这一领域。
德国人Demidov
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.