众所周知,如果数据来自正态分布总体,则Wilcoxon符号秩检验的渐近相对效率(ARE)与Student t检验相比为。基本的一样本测试和两个独立样本的变体(Wilcoxon-Mann-Whitney U)都是如此。对于正常数据,与ANOVA F检验相比,它也是Kruskal-Wallis检验的ARE 。
众所周知,如果数据来自正态分布总体,则Wilcoxon符号秩检验的渐近相对效率(ARE)与Student t检验相比为。基本的一样本测试和两个独立样本的变体(Wilcoxon-Mann-Whitney U)都是如此。对于正常数据,与ANOVA F检验相比,它也是Kruskal-Wallis检验的ARE 。
Answers:
用于一样本检验,带符号检验和带秩检验的ARE的简图
我希望@Glen_b答案的详细版本包括对两个样本的带符号秩检验的详细分析以及ARE的直观解释。因此,我将跳过大部分推导。(一个样本的情况,您可以在Lehmann TSH中找到缺失的详细信息)。
测试问题:假设是位置模型的随机样本,对称于零。我们将计算假设相对于t检验的有符号检验,有符号秩检验的ARE 。 ˚F (X - θ )ħ 0:θ = 0
为了评估测试的相对效率,仅考虑局部替代方案,因为一致的测试的功效相对于固定替代方案趋向于1。对于非固定,产生非平凡渐近幂的局部替代方法通常为的形式,在某些文献中称为Pitman漂移。 ^ h
我们未来的任务是
测试统计量和渐近线
因此, 如果是标准法线密度,则,
如果在[-1,1]上是均匀的,则,
关于替代方案下的派生的说明
当然,有很多方法可以得出替代方案下的极限分布。一种通用方法是使用Le Cam的第三引理。它的简化版本说明
令为似然比的对数。对于某些统计 ,如果 在空值下,然后是
对于二次平均微分密度,将自动满足局部渐近正态性和连续性,这反过来又暗示了Le Cam引理。使用这个引理,我们只需要在空值下计算。遵循LAN其中是得分函数,是信息矩阵。然后,例如,对于签名测试
这与解释为什么出现(与其他人很好地解释过)无关,但可能会直观地帮助您。Wilcoxon检验是等级的检验,而参数检验是根据原始数据计算的。Wilcoxon检验相对于检验的效率是两个检验所用得分之间相关性的平方。随着的平方相关收敛到。您可以使用R轻松地凭经验看到这一点:
n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(显然会产生相同的结果)?
简短版:使用Wilcoxon-Mann-Whitney进行换档时的基本原因是,找到渐近相对效率(WMW / t)对应于评估其中是零点处的公共密度,是公共方差。
因此,通常,实际上是的可缩放版本;它的积分将带有项;平方时,这就是。
签名等级测试的ARE中涉及相同的术语(具有相同的积分),因此采用相同的值。
对于相对于t的符号测试,ARE为 ...,而再次具有。
所以本质上就是我在评论中说的;在Wilcoxon-Mann-Whitney与两样本t检验,Wilcoxon符号秩检验与一样本t检验,符号检验与一样本t检验的ARE中(在每种情况下均为一般),因为它以正常密度出现。
参考:
JL Hodges和EL Lehmann(1956),
“ t检验的一些非参数竞争者的效率”,
Ann。数学。统计员。,27:2,324-335。