Answers:
由于Kolmogorov-Smirnov用于完全指定的分布,因此您甚至无法真正比较两者(因此,如果您要测试正态性,则必须指定均值和方差;无法从数据中估算它们)*,而Shapiro-Wilk用于正态性,具有不确定的均值和方差。
*您也无法通过使用估计的参数进行标准化并测试标准正态;这实际上是同一件事。
比较的一种方法是用在正常情况下指定均值和方差的检验(以某种方式组合检验)补充Shapiro-Wilk,或者通过调整KS表以进行参数估计来进行补充(但随后不再分配) -自由)。
有一个这样的测试(相当于带有估计参数的Kolmogorov-Smirnov)– Lilliefors测试;正常性测试版本可以与Shapiro-Wilk进行有效比较(通常功率较低)。更具竞争力的是安德森·达林(Anderson-Darling)测试(还必须针对参数估计进行调整,以使比较有效)。
至于他们要检验的东西-KS检验(和Lilliefors)着眼于经验CDF与指定分布之间的最大差异,而Shapiro Wilk有效地比较了两个方差估计值。密切相关的Shapiro-Francia可被视为QQ图中平方相关的单调函数;如果我没记错的话,Shapiro-Wilk还考虑了订单统计信息之间的协方差。
编辑添加:尽管Shapiro-Wilk在感兴趣的替代方案上几乎总是击败Lilliefors测试,但在中型样本( -ish)中的却不是这样。那里的小人有更高的权力。
[应该记住,可用的正常性测试比这些更多。
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
-如果p值符合应有的值,那看起来就一样!
简而言之,Shapiro-Wilk检验是针对正态性的特定检验,而Kolmogorov-Smirnov检验所使用的方法更通用,但功能更弱(这意味着它很少正确地拒绝正态性的零假设)。两种统计均以正态为零,并基于样本建立检验统计,但是二者的操作方式有所不同,使它们对正态分布的特征或多或少敏感。
确切地计算出W(Shapiro-Wilk的检验统计量)是如何涉及的,但从概念上讲,它涉及按大小排列样本值并根据预期均值,方差和协方差来衡量拟合度。据我所知,这些与正态性的多重比较给测试带来了比Kolmogorov-Smirnov检验更大的能力,这是它们可能有所不同的一种方式。
相比之下,正态性的Kolmogorov-Smirnov检验是通过将预期累积分布与经验累积分布进行比较来评估拟合优度的一般方法得出的,即:
因此,它在分布的中心而不是尾部敏感。但是,KS测试是收敛的,从某种意义上说,随着n趋于无穷大,测试收敛到概率的真实答案(我相信Glivenko-Cantelli定理在这里适用,但是有人可以纠正我)。这是这两种测试的正常性评估可能有所不同的另外两种方式。