根据Wikipedia,我了解到,当样本是来自正态分布总体的iid观测值时,t分布就是t值的样本分布。但是,我不直观地理解为什么这会导致t分布的形状从肥尾变为几乎完全正常。
我得到的是,如果您从正态分布中进行采样,那么如果您进行大样本采样,它将类似于该分布,但是我不知道为什么它从它的胖尾形状开始。
根据Wikipedia,我了解到,当样本是来自正态分布总体的iid观测值时,t分布就是t值的样本分布。但是,我不直观地理解为什么这会导致t分布的形状从肥尾变为几乎完全正常。
我得到的是,如果您从正态分布中进行采样,那么如果您进行大样本采样,它将类似于该分布,但是我不知道为什么它从它的胖尾形状开始。
Answers:
我将尝试给出一个直观的解释。
t统计量*具有分子和分母。例如,一个样本t检验中的统计量为
*(有几个,但是希望此讨论应该足够笼统以涵盖您所要询问的内容)
在此假设下,分子具有正态分布,均值为0,未知标准偏差为零。
在相同的一组假设下,分母是分子分布的标准偏差(分子统计量的标准误差)的估计值。它独立于分子。其平方是卡方随机变量除以其自由度(也是t分布的df)乘以。
当自由度较小时,分母趋向于相当右偏。它有很大的机会小于其平均值,而有一个相当小的机会。同时,它也有可能比其平均值大得多。
在正态性假设下,分子和分母是独立的。因此,如果我们从该t统计量的分布中随机抽取,则会得到一个正常的随机数除以右偏分布中第二个随机*选择的值,该值的平均值约为1。
*不考虑正常用语
因为它在分母上,所以分母分布中的小值会产生非常大的t值。分母的右偏使t统计量重尾。当位于分母上时,分布的右尾部使t分布比与t具有相同标准偏差的正态峰更尖锐。
但是,随着自由度变大,分布看起来更正常,并且在其均值周围更加“紧密”。
这样,随着自由度的增加,分母对分子分布形状的影响减小。
最终-正如Slutsky定理所暗示的那样,我们可能会发生-分母的作用变得更像是被常数除,并且t统计量的分布非常接近正态。
豪布尔在评论中建议,看一下分母的倒数可能会更有启发。也就是说,我们可以将t统计量写为分子(正常)乘以分母的倒数(右偏)。
例如,我们上面的一样本t统计量将变为:
现在考虑在原有的总体标准差,σ X。我们可以乘以它,如下所示:
第一项是标准正态。第二项(缩放后的反卡方随机变量的平方根)然后通过大于或小于1的值来缩放标准法线,“将其散布”。
在正常的假设下,产品中的两个术语是独立的。因此,如果我们从该t统计量的分布中随机抽取,我们将得到一个正常的随机数(乘积中的第一项)乘以右偏分布为“通常约为1。
当df较大时,该值趋于非常接近1,但是当df较小时,其偏斜度较大,并且展开较大,此缩放因子的右尾较大会使尾部很胖:
@Glen_b让您直观地了解为什么随着样本量的增加,t统计量看起来更正常。现在,我将为您提供有关统计信息分布情况的详细技术说明。
有可能表明
和
如 。通过取这两个极限的乘积,您可以看到Student-t密度完全收敛到标准法线密度。
我只是想分享一些有助于初学者的直觉的东西(尽管它比其他答案没有那么严格)。
如果 是标准的正常RV,然后是以下RV,
与t分布 自由程度。
如 变得很大,使用大数定律,我们可以看到分母变为 。所以你只剩下 这是标准正态,这就是为什么t分布看起来像正态 变大。
详细说明...请注意 表示卡方RV的期望值为1。平方根中的分数只是的样本均值 艾德 房车。样本平均值为 变得超大将等于其中之一的期望值 是的。
这样 变得很大,您只剩下