如果假设非参数测试的功效比其参数替代品的能力小,这是否意味着如果任何参数测试都不拒绝null,那么其非参数替代品也不会拒绝null?如果不满足参数测试的假设并且仍然使用测试,如何改变?
如果假设非参数测试的功效比其参数替代品的能力小,这是否意味着如果任何参数测试都不拒绝null,那么其非参数替代品也不会拒绝null?如果不满足参数测试的假设并且仍然使用测试,如何改变?
Answers:
如果参数检验未能拒绝原假设,那么其非参数等价项肯定仍可以拒绝原假设。就像@John所说的那样,这通常发生在违反了保证使用参数测试的假设时。例如,如果我们将两个样本的t检验与Wilcoxon秩和检验进行比较,那么如果我们在数据中包含离群值,我们就可以发生这种情况(对于离群值,我们不应该使用两个样本检验)。
#Test Data
x = c(-100,-100,rnorm(1000,0.5,1),100,100)
y = rnorm(1000,0.6,1)
#Two-Sample t-Test
t.test(x,y,var.equal=TRUE)
#Wilcoxon Rank Sum Test
wilcox.test(x,y)
运行测试的结果:
> t.test(x,y,var.equal=TRUE)
Two Sample t-test
data: x and y
t = -1.0178, df = 2002, p-value = 0.3089
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.6093287 0.1929563
sample estimates:
mean of x mean of y
0.4295556 0.6377417
>
> wilcox.test(x,y)
Wilcoxon rank sum test with continuity correction
data: x and y
W = 443175, p-value = 5.578e-06
alternative hypothesis: true location shift is not equal to 0
没有。
尽管参数测试可能更强大,但并非总是如此。如果不是这种情况,那么通常是在您不应该运行参数测试的情况下。
但是,即使您从参数检验具有较高功效的方差相等的正态分布中收集体面大小的样本,也不能保证对于任何特定实验,非重要的参数检验都意味着非重要的非参数检验。这是一个仅使用正态分布随机抽样的模拟,发现对于t检验,p> 0.05,对于Wilcoxon检验,p <0.05,大约有1.8%的时间。
nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
tt <- t.test(y1, y2, var.equal = TRUE)
wt <- wilcox.test(y1, y2)
c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim
您可能会注意到,在此模拟中,参数测试的功效大于非参数测试的功效(尽管它们是相似的)。
sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power
但是,如上所述,这并不意味着在所有参数测试均未找到非参数测试也将失败的效果的情况下。
您可以进行此模拟。使n很大,例如1000,并使效果大小小得多,例如0.02(如果测试失败,则需要低功耗才能拥有大量样本)。如果n为1000,则可以保证所有样本均不会因非正态性(通过检查而不是愚蠢的测试)而被拒绝或有可疑的异常值。然而,一些参数测试结果并不重要,而非参数测试结果却很重要。
您可能还想看看Hunter&May(1993)。
马萨诸塞州的亨特(Hunter),马克斯(RB)和梅(May)(1993)。关于参数测试和非参数测试的一些神话。加拿大心理学,34(4),384-389。