这是弗兰克·哈雷尔(Frank Harrell)在这里写的后续问题:
以我的经验,准确的t分布所需的样本大小通常大于手头的样本大小。正如您所说,Wilcoxon符号秩检验非常高效,而且功能强大,因此我几乎总是喜欢它而不是t检验
如果我理解正确,则在比较两个不匹配样本的位置时,如果样本量较小,我们宁愿使用Wilcoxon秩和检验而不是不配对t检验。
从理论上讲,即使我们两组的样本量相对较大,我们还是更愿意使用Wilcoxon秩和检验而不是不成对的t检验吗?
我对这个问题的动机来自观察到的是,对于单个样本t检验,将其用于偏小分布的不太小的样本会产生错误的I型错误:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error