Answers:
检验的假设和假设存在差异。
方差分析(和t检验)明确地是对均值的相等性的检验。从技术上讲,Kruskal-Wallis(和Mann-Whitney)可以看作是平均排名的比较。
因此,就原始值而言,Kruskal-Wallis 比均值比较更为笼统:它测试了来自每组的随机观测是否同样有可能高于或低于来自另一组的随机观测的概率。作为比较基础的实际数据量既不是均值差异也不是中位数差异(在两个示例中),它实际上是所有成对差异的中位数 -样本间Hodges-Lehmann差异。
但是,如果您选择做一些限制性假设,那么Kruskal-Wallis可以看作是检验总体均值,分位数(例如中位数)以及其他各种指标的均等性。也就是说,如果您假设原假设下的组分布是相同的,并且在替代假设下,唯一的变化是分布偏移(所谓的“ 位置偏移替代 ”),那么它也是一个检验均值均值(以及同时的中位数,较低四分位数等)。
[如果您做出此假设,则可以像使用ANOVA一样获得相对位移的估计值和间隔。好了,也可以在没有这种假设的情况下获得间隔,但是它们更难以解释。]
如果您看这里的答案,尤其是最后的答案,它将讨论t检验与Wilcoxon-Mann-Whitney之间的比较,(至少在进行两尾检验时)相当于ANOVA和Kruskal-Wallis仅用于两个样本的比较;它提供了更多细节,并且大部分讨论都延续到了Kruskal-Wallis对ANOVA的讨论中。
实际差异并不清楚您的意思是什么。您通常以类似的方式使用它们。当两组假设都适用时,它们通常倾向于给出相当相似的结果,但是在某些情况下它们当然可以给出相异的p值。
编辑:这是一个即使在小样本情况下推理相似度的示例-这是从正态分布(小样本量)中抽样的三组(第二组和第三组与第一组相比)之间位置偏移的联合接受区域对于特定数据集,为5%的水平:
可以看到许多有趣的特征-在这种情况下,KW的接受区域略大,其边界由垂直,水平和对角直线段组成(不难找出原因)。这两个区域告诉我们有关所关注参数的信息非常相似。
set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")
> kruskal.test(list(x,y))
Kruskal-Wallis rank sum test
data: list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152
正如我在一开始所声称的那样,我不确定KW的精确构造。也许我的答案对于另一个非参数检验(Mann-Whitney?..)更正确,但是方法应该相似。
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersion
正如Glen的回答,评论以及本网站上的许多其他地方所提到的,这是正确的,但是对测试功能的阅读范围狭窄。same shape/dispersion
实际上不是一个固有的假设,而是在某些情况下使用而在其他情况下不使用的附加假设。
distributions are equal
,这样认为是错误的。H0只是,以图解方式,“重力的凝结”的两个点并不彼此偏离。
the equality of the location parameters of the distribution
是正确的表述(通常不应将“位置”视为平均值或中位数)。如果您采用相同的形状,那么自然地,该相同的H0就变成“相同分布”。
Kruskal-Wallis基于等级,而不是基于价值。如果分布偏斜或存在极端情况,这可能会有很大的不同