为什么F检验对正态性假设如此敏感？

16

为什么方差差异的F检验对正态分布的假设如此敏感，即使对于大？ $N$

我试图在网上搜索并访问了图书馆，但是没有一个给出好的答案。它说测试对于违反正态分布假设非常敏感，但是我不明白为什么。有人对此有很好的答案吗？

normality-assumption f-test

6

F

$F$ 您对哪个

检验感兴趣？

— S. Kolassa-恢复莫妮卡

F检验，用于测量方差差异。

— Magnus Johannesen

35

我假设您是指在检验一对样本方差是否相等时进行方差比的F检验（因为这是对正态性非常敏感的最简单的检验；对于ANOVA的F检验敏感性较低）

如果您的样本是从正态分布中提取的，则样本方差具有缩放的卡方分布

想象一下，您拥有的分布比正态分布更重，而不是从正态分布中获取数据。然后，相对于按比例缩放的卡方分布，您将获得太多的大方差，并且样本方差进入最右边尾部的概率对从中提取数据的分布尾部非常敏感。（也有太多小的变化，但效果不太明显）

现在，如果两个样本均从较重的尾部分布中提取，则分子上的较大尾部将产生过量的大F值，而分母上的较大尾部将产生过量的小F值（反之亦然）

即使两个样本具有相同的方差，这两种影响也会趋于导致两尾测试的排斥。这意味着当真实分布的尾部比正常情况重时，实际显着性水平往往会高于我们想要的水平。

相反，从较轻的尾部分布中抽取样本会产生样本方差的分布，而尾部的分布太短-与使用正态分布的数据相比，方差值往往更“中等”。同样，在远处的上尾部的冲击比下尾部更强。

现在，如果两个样本均从该较轻的尾部分布中抽取，则这将导致中值附近的F值过多，并且任一尾巴中的F值都太少（实际显着性水平将低于期望值）。

随着样本数量的增加，这些影响似乎并不一定会减少很多。在某些情况下，情况似乎会变得更糟。

通过部分说明的方式，这里是10000样本方差（对于 $n=10$ ）为正常， $t_5$ 和均匀的分布，缩放为具有相同的平均值作为 $\chi^2_9$ ：

很难看到远处的尾巴，因为它与峰值相比相对较小（对于 $t_5$ ，尾巴中的观测值以合理的方式超出了我们绘制的位置），但是我们可以看到一些影响方差的分布。通过卡方cdf的逆变换来转换它们可能更具启发性，

在正常情况下看起来应该是均匀的（应如此），在t情况下，上尾部有一个大峰（下尾部有一个小峰），而在统一情况下则更像山丘，但宽阔峰值大约在0.6到0.8之间，极端情况的概率要比从正态分布中抽样时的概率低得多。

$F_{9,9}$

$t_5$

还有很多其他案例需要进行全面研究，但这至少可以使人对效果的种类和方向以及它的产生方式有所了解。

— Glen_b-恢复莫妮卡
source

1

真不错的演示

— Shadowtalker，2016年

3

正如Glen_b在他的模拟中出色地说明的那样，方差比的F检验对分布的尾部很敏感。这是因为样本方差的方差取决于峰度参数，因此基础分布的峰度对样本方差比的分布有很大影响。

$S_N^2$ $S_n^2$ $n<N$ $^\dagger$

\frac{{小号}_{ñ}^{2}}{{小号}_{ñ}^{2}} \overset{约}{〜} \frac{ñ - 1个}{ñ - 1个} + \frac{ñ - ñ}{ñ - 1个} \cdot F （ d F_{C} ， d F_{ñ} ） ，

$\frac{S_N^2}{S_n^2} \overset{\text{Approx}}{\sim} \frac{n-1}{N-1} + \frac{N-n}{N-1} \cdot F(DF_C, DF_n),$

$\kappa$

d F_{ñ} = \frac{2 ñ}{κ - （ ñ - 3 ） / （ ñ - 1个 ）} d F_{C} = \frac{2 （ ñ - ñ ）}{2 + （ κ - 3 ） （ 1个 - 2 / ñ + 1个 / ñ ñ ）} 。

$DF_n = \frac{2n}{\kappa - (n-3)/(n-1)} \quad \quad \quad DF_C = \frac{2(N-n)}{2+(\kappa-3)(1-2/N+1/Nn)}.$

$\kappa=3$ $DF_n = n-1$ $DF_C = N-n$

$\hat{\kappa}$

$^\dagger$ $N-1$ $N$

— 恢复莫妮卡
source

+1这是一个非常有趣的帖子。当然，对于中速分布，要使方差比分布尽可能远离F，就很难通过全范围的分布选择来实现，但是识别案例并不难（根据我的回答，样本数为10 10）实际的I型错误率与标称的0.05错误率略有不同。我尝试的前3个案例（分布峰度= 3的分布-它们也都是对称的）的I型拒绝率为0.0379、0.0745和0.0785。... ctd

— Glen_b-恢复莫妮卡

ctd ...我毫不怀疑，只要稍加思考如何使近似值变差，就可以确定更多的极端情况。我想，它（不会显着影响显着性水平）在较大样本中可能会更好。

— Glen_b-恢复莫妮卡