为什么T统计量需要数据遵循正态分布


11

我当时在看这个笔记本,但对此陈述感到困惑:

当我们谈论正态性时,我们的意思是数据应该看起来像正态分布。这很重要,因为几个统计检验都依赖于此(例如t统计)。

我不明白为什么T统计量需要数据遵循正态分布。

确实,维基百科说了同样的话:

学生的t分布(或简称为t分布)是连续概率分布族的任何成员,该族在估计正态分布总体的均值时出现

但是,我不明白为什么这个假设是必要的。

它的公式没有向我表明数据必须服从正态分布:

在此处输入图片说明

我看了一下它的定义,但我不明白为什么需要这种条件。

Answers:


17

您需要的信息在Wiki页面的“特征化”部分中。甲与自由度-配送可以被定义为随机变量的分布使得 其中是一个标准正态分布随机变量,是一个与自由度随机变量。此外,和必须独立。因此,给定 遵循上述定义的和,您就可以得出具有ν Ť Ť = žtνTž V χ 2 ν ž V ž V

T=ZV/ν,
ZVχ2νZVZVt

现在,假设根据分布分布。令具有均值和方差。令为样本均值,为样本方差。然后,我们将看一下公式: ˚F ˚F μ σ 2 ˉ X小号2X1,X2,,XnFFμσ2X¯S2

X¯μS/n=X¯μσ/n(n1)S2(n1)σ2.

如果表示正态分布,则,因此。此外,根据Cochran定理,。最后,通过应用巴苏定理,和是独立的。然后,这意味着,所得到的统计量具有与-配送自由度。ˉ XÑ μ σ 2 / Ñ ˉ X - μFX¯N(μ,σ2/n)ñ-1s ^2X¯μσ/nN(0,1) ˉ X小号2Ñ-1(n1)S2σ2χn12X¯S2tn1

如果原始数据分布不是正态的,则分子和分母的精确分布将分别不是标准正态和,因此所得统计量将不具有。χ 2 Ť的连线Fχ2t


3
我总是发现非常有趣的是,在数学统计的这些基本结果中使用了多少数学技术。
马修·德鲁里

3
X¯Sχ2

2

我认为统计量及其公式与分布及其公式之间可能会有些混淆。您可以将t统计量公式应用于任何数据集并获得“ t统计量”,但是除非根据数据来自正态分布(或者至少不会来自正态分布),否则该统计量不会根据Student-t分布进行分布可以肯定;我的猜测是,当应用t统计公式时,非正态分布不会产生Student-t分布,但我不确定。原因很简单,因为t统计量的分布是根据生成t统计量的数据的分布计算得出的,因此,如果您具有不同的基础分布,则不能保证导出统计量具有相同的分布。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.