QQ情节看起来正常,但Shapiro-Wilk测试却相反


12

在R中,我有348个度量的样本,并且想知道是否可以假定它正态分布以用于将来的测试。

本质上是在遵循另一个Stack答案之后,我正在使用以下命令查看密度图和QQ图:

plot(density(Clinical$cancer_age))

在此处输入图片说明

qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)

在此处输入图片说明

我没有统计方面的丰富经验,但是它们看起来像我所见过的正态分布示例。

然后,我正在运行Shapiro-Wilk测试:

shapiro.test(Clinical$cancer_age)

> Shapiro-Wilk normality test

data:  Clinical$cancer_age
W = 0.98775, p-value = 0.004952

如果我正确地解释它,它告诉我可以否定原假设,即分布是正态的。

但是,我遇到了两个Stack帖子(herehere),这些帖子严重破坏了此测试的用处。看起来如果样本很大(348是否被认为是大样本?),它将总是说分布不正常。

我应该如何解释所有这些?我应该坚持使用QQ图并假设我的分布是正常的吗?


4
qq图似乎显示出尾部偏离正常。同样,任何有用的拟合优度检验都将在非常大的样本中拒绝,仅仅是因为检测到的与正常值之间的偏差很小。.这并不是对Shapiro-Wilk检验的批评,而是针对拟合优度检验的一个特征。
Michael R. Chernick

4
为什么假设正态分布对您很重要?根据这个假设,您打算做什么?
罗兰

6
只是为了补充Roland的评论,许多正式假设正态分布的测试在偏离正态性稍有偏离的情况下实际上是相当健壮的(例如,因为测试统计量的分布是渐近正确的)。如果您可以详细说明您打算做什么,则可能会得到更多有用的答案。
P.Windridge

1
@mdewey,敏锐的观察!它不是发病年龄,而是通过DNA甲基化测量的肿瘤“年龄”。
francoiskroll

2
我认为仅检查少量极端观测值是否是测量误差是值得的。
mdewey

Answers:


11

您在这里没有问题。您的数据可能有点不正常,但足够正常,不会造成任何问题。许多研究人员在假设正常性的情况下进行统计检验,而正常数据要比您所拥有的得多。

我会相信你的眼睛。尽管尾部略有偏斜,但密度和QQ图看起来还是合理的。我认为,您无需担心这些数据的非正常性。

您的N约为350,p值非常取决于样本大小。对于大样本,几乎任何事情都可能是重要的。这里已经讨论过了。

在这个非常受欢迎的帖子上有一些令人难以置信的答案,它们的基本结论是,对非正态性进行零假设假设显着性检验“基本上是无用的”。关于该帖子的公认答案是一个极好的证明,即使数据是从几乎高斯的过程生成的,足够高的样本量也会使非正常测试变得重要。


抱歉,我意识到我链接到您在原始问题中提到的帖子。但是,我的结论仍然成立:您的数据不是很正常,应该会带来问题。


仅仅因为some.researchers非常草率并不意味着您可以有点草率:)。但是,我同意许多正式假设正态性的统计检验实际上对您所喂食的食物具有
一定的容忍度

2
“仅仅因为some.researchers非常草率并不意味着你可以有点草率:)” 对我而言这是一个不好的论点。“不过,我同意许多正式假设正常性的统计检验实际上可以容忍你喂养它们的东西。” 确实是的。我曾经看过的任何定量教授都看过这样的QQ图并说:“是的,没关系。”
马克·怀特

4

您的分配正常。看一下尾巴(或没有尾巴)。以下是正常QQ图的预期结果。

在此处输入图片说明

有关如何解释各种QQ图的信息,请参阅帖子。

请记住,尽管从技术上讲发行版可能不正常,但它可能足以满足需要正常性的算法。


1
您在说什么,我使用代码集运行了9个正态qq图,这些直角图由样本直接形成正态分布.seed(100)par(mfrow = c(3,3))for(i in 1:9){x < -rnorm(350)qqnorm(x)qqline(x)}和图(3,2)看起来与OP的情况非常相似。
乔什(Josh)2013年

1
通常,您不希望集中在尾巴上,因为它们经常会很奇怪,尽管极差的尾巴会给您带来差劲的结果。您真的想专注于中间。
乔什(Josh)2013年

你是不正确的乔希。请上诉至正常检验,以检查正常性的零假设是否被拒绝。
纠正

1
你是对的。我最初阅读您的帖子是因为qq情节不够正常,我深表歉意。
乔什(Josh)2013年

2
@Josh,分布的中间对于假设检验几乎没有关系;尾巴很重要。你有倒退。
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.