为什么对于正态分布数据,Wilcoxon检验的渐进相对效率与Student的t检验相比?


13

众所周知,如果数据来自正态分布总体,则Wilcoxon符号秩检验的渐近相对效率(ARE)与Student t检验相比为。基本的一样本测试和两个独立样本的变体(Wilcoxon-Mann-Whitney U)都是如此。对于正常数据,与ANOVA F检验相比,它也是Kruskal-Wallis检验的ARE 。3π0.955

这个显着的结果(对我来说,π的“ 最意外的外观之一 ”)和非常简单的结果是否有深刻的,显着的或简单的证明?


鉴于外观正常CDF,外观在没有确实应该使人感到意外。我会警告一个答案,但是要花一个好的时间还需要一段时间。πππ
Glen_b-恢复莫妮卡2014年

1
@Glen_b确实-我之前已经看过“为什么在统计数据中出现这么多”的讨论(尽管不记得它是否在简历上)和“由于正态分布”,我知道很多,但是在您第一次看到它时仍然令人惊喜。为了进行比较,Mann-Whitney与两个样本的t检验的ARE在指数数据上为3,在双指数上为1.5,在均匀上为1-更圆了!3 / ππ3/π
Silverfish 2014年

1
@Silverfish我已将van der Vaart的第197页链接为“渐近统计”。对于一个样本,符号检验相对于t 检验具有ARE。2/π
Khashaa 2014年

1
@Silverfish ...,在后勤阶段是。有很多众所周知的ARE(在一个或两个示例情况下)都涉及还有很多是简单的整数比。 π(π/3)2π
Glen_b-恢复莫妮卡2014年

1
对于一个样本的带符号秩检验,似乎是。对于单样本符号测试,它是。因此,我们澄清了立场。我认为这是一个好兆头。2 / π3/π2/π
Khashaa 2014年

Answers:


10

用于一样本检验,带符号检验和带秩检验的ARE的简图t

我希望@Glen_b答案的详细版本包括对两个样本的带符号秩检验的详细分析以及ARE的直观解释。因此,我将跳过大部分推导。(一个样本的情况,您可以在Lehmann TSH中找到缺失的详细信息)。

测试问题:假设是位置模型的随机样本,对称于零。我们将计算假设相对于t检验的有符号检验,有符号秩检验的ARE 。 ˚F X - θ ħ 0θ = 0X1,,Xnf(xθ)H0:θ=0

为了评估测试的相对效率,仅考虑局部替代方案,因为一致的测试的功效相对于固定替代方案趋向于1。对于非固定,产生非平凡渐近幂的局部替代方法通常为的形式,在某些文献中称为Pitman漂移 ^ hθn=h/nh

我们未来的任务是

  • 在null下找到每个检验统计量的极限分布
  • 找出替代项下每个检验统计量的极限分布
  • 计算每个测试的局部渐近能力

测试统计量和渐近线

  1. t检验(假设存在) Ñ = σ
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • 因此,如果具有渐近幂函数 ,则拒绝测试 1 - Φ ž α - ħ 1tn>zα
      1Φ(zαh1σ)
  2. 签名测试并且具有局部渐近幂 Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. 有符号秩检验 并且具有局部渐近幂
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

因此, 如果是标准法线密度,则,

ARE(Sn)=(2f(0)σ)2
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

如果在[-1,1]上是均匀的,则,fARE(Sn)=1/3ARE(Wn)=1/3

关于替代方案下的派生的说明

当然,有很多方法可以得出替代方案下的极限分布。一种通用方法是使用Le Cam的第三引理。它的简化版本说明

令为似然比的对数。对于某些统计 ,如果 在空值下,然后是ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

对于二次平均微分密度,将自动满足局部渐近正态性和连续性,这反过来又暗示了Le Cam引理。使用这个引理,我们只需要在空值下计算。遵循LAN其中是得分函数,是信息矩阵。然后,例如,对于签名测试cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1我不会讲这么多的细节(实际上,您的回答已经很好地涵盖了问题,我可能不会在现在的内容中添加任何内容),因此,如果您想提出更多的细节,请不要不要再拖延我的帐户了。我会一直好几天,但(仍低于你已经有),所以这是你进来是好事。
Glen_b -Reinstate莫妮卡

对于添加Le Cam的引理(+1)而言,这是一个很好的答案。在我看来,在1、2和3中建立渐近性与编写ARE的“因此”位之间有很大的飞跃。我想如果我写这篇文章,我会在此时定义渐近效率(或者可能更早些,因此,第1、2和3点的结果不仅是每种情况下的局部渐近幂,而且还会是AE),然后是步骤将来的读者可以更容易地使用ARE。
银鱼

也许值得指定您的?一面和两面情况具有看似渐近的渐近力(尽管它们导致相同的ARE)。H1
银鱼

随时编辑我的答案或将其附加到OP。
2015年

1
@Khashaa谢谢。当我面前有合适的内容时,我将编辑您的帖子。您介意在最终方程式中澄清的含义吗?
银鱼

6

这与解释为什么出现(与其他人很好地解释过)无关,但可能会直观地帮助您。Wilcoxon检验是等级的检验,而参数检验是根据原始数据计算的。Wilcoxon检验相对于检验的效率是两个检验所用得分之间相关性的平方。随着的平方相关收敛到。您可以使用R轻松地凭经验看到这一点:πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

这确实是一个非常有用的评论。从概念上讲,它是否更接近n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2(显然会产生相同的结果)?
银鱼

(被弗兰克(Frank)评论激起兴趣的人们可能想看看关于Wilcoxon-Mann-Whitney U的等价性和等级上的t检验的问题。)
Silverfish

我对此答案不了解的是,对于较低的值,相关性更高(我认为最接近的原因是,对于较小的,我们看不到尾巴很好)。天真地意味着对于小,Wilcoxon的相对效率更高,这让我感到惊讶。(我可能会做一些模拟,但是(a)如果有一个简单的答案...并且(b)我是否在某个地方缺少概念要点?)nnn
Ben Bolker

据我回忆,Wilcoxon有符号秩检验和WMW的小样本效率都比正态分布的移位替代方案的渐近值低。
Glen_b-恢复莫妮卡

5

简短版:使用Wilcoxon-Mann-Whitney进行换档时的基本原因是,找到渐近相对效率(WMW / t)对应于评估其中是零点处的公共密度,是公共方差。12σ2[f2(x)dx]2fσ

因此,通常,实际上是的可缩放版本;它的积分将带有项;平方时,这就是。f2f1ππ

签名等级测试的ARE中涉及相同的术语(具有相同的积分),因此采用相同的值。

对于相对于t的符号测试,ARE为 ...,而再次具有。4σ2f(0)2f(0)2π

所以本质上就是我在评论中说的;在Wilcoxon-Mann-Whitney与两样本t检验,Wilcoxon符号秩检验与一样本t检验,符号检验与一样本t检验的ARE中(在每种情况下均为一般),因为它以正常密度出现。π

参考:

JL Hodges和EL Lehmann(1956),
“ t检验的一些非参数竞争者的效率”,
Ann。数学。统计员。27:2,324-335。


我喜欢关于分母出现的直觉的解释;在WMW / Wilcoxon积分中Renyi熵出现本质上是巧合吗?π
银鱼

@Silverfish出现肯定不是巧合。但是,这并不是因为这与Rényi熵有关,或者至少我没有看到任何直接联系。不过,我们正在进入我现在还不太了解的东西。f2dx
Glen_b-恢复莫妮卡2015年

@Silverfish这只是的Renyi熵。否则,它只是一个普通的旧广场,可以以一百万种不同的方式出现。α=2
abalter
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.