Shapiro-Wilk检验的解释


29

我是统计学的新手,需要您的帮助。
我有一个小样本,如下所示:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

我使用R运行了Shapiro-Wilk测试:

shapiro.test(precisionH4U$H4U)

我得到以下结果:

 W = 0.9502, p-value = 0.6921

现在,如果我假设在0.05处的显着性水平大于p值,则alpha(0.6921> 0.05),并且我不能拒绝关于正态分布的零假设,但是我是否可以说样本具有正态分布?

谢谢!

Answers:


28

不可以-您不能说“样本具有正态分布”或“样本来自具有正态分布的总体”,而只能说“您不能拒绝样本来自具有正态分布的总体的假设”。

实际上,样本不具有正态分布(请参见下面的qqplot),但由于它只是一个样本,所以您不会期望它具有正态分布。有关基本人口分布的问题仍然悬而未决。

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
我认为qqplot看起来很正常...您可以尝试qqnorm(rnorm(9))几次...
好奇

2
@Tomas:也许最好说“ qqplot看起来好像可能来自正常人群”。相反,它可能来自尾部较重的分布。
亨利

是的,qqnorm(runif(9))可以产生相似的结果。所以我们实际上不能说什么...
好奇

“样本具有正态分布”和“样本来自具有正态分布的总体”之间有什么区别?
auraham

1
正态分布是所有实数上的连续分布。样本(有限的,甚至可数的无限)本身不能具有这种分布,即使它是从具有这种分布的总体中得出的。
亨利

17

不拒绝零假设是一个迹象,你有样本太小,捡起你有什么正常的偏差-但你的样品是如此之小,甚至从常态相当大的偏差可能不会被检测到。

但是假设检验,是一个很值得在大多数情况下,跑题了,人们用正常进行的测试-你真正知道答案,你正在测试的问题-从数据人口的分布绘制的将是正常的。(有时可能很接近,但实际上是正常的吗?)

您应该关心的问题不是“是从正常分布中得出的分布”(不是)。您实际上应该关心的问题更像是“偏离正常值会严重影响我的结果吗?”。如果这可能是一个问题,则可以考虑进行分析的可能性较小。


10

t

tt

我进一步推测您正在查看比例,在这种情况下,如果您担心违反假设,则可以使用二项分布。

如果是让您进行Shapiro测试的其他问题,您可以忽略我刚才所说的一切。


您说对了,我想知道是否可以对样本进行t检验。谢谢!
雅各布(Jakub)

4

正如亨利已经说过的,你不能说这是正常的。只需尝试在R中多次运行以下命令:

shapiro.test(runif(9)) 

这将从均匀分布中测试9个数字的样本。很多时候,p值会大于0.05,这意味着您不能得出正态分布的结论。


4

我还在研究如何在Shapiro-Wilk检验中正确解释W值,并且根据Emil OW Kirkegaard的文章“ 使用不同数据集可视化的Shapiro-Wilk检验中的W值 ”,很难说出分布只看W值。

正如他总结所言:

通常,我们看到在给定大量样本的情况下,SW对偏离非正态性很敏感。但是,如果偏离很小,那不是很重要。

我们还看到,即使有人刻意尝试,也很难降低W值。一个人需要测试极端的非正态分布,以使其明显下降到.99以下。

有关更多信息,请参见原始文章。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.