Answers:
Mann-Whitney检验是置换检验的一种特殊情况(通过查看所有可能的数据置换得出零值下的分布),并且置换检验将零值视为相同的分布,因此在技术上是正确的。
曼恩·惠特尼检验统计量的一种思考方式是衡量一组随机选择的值超过另一组随机选择的值的次数。因此P(X> Y)= 0.5也是有道理的,并且从技术上讲,这是等分分布为null的一个属性(假设出现平局概率为0的连续分布)。如果2个分布相同,则X大于Y的概率为0.5,因为它们都是从相同的分布中得出的。
所陈述的2个分布具有相同的均值但方差差异很大的情况与第二个无效假设相匹配,但与第一个相同的分布不匹配。我们可以做一些模拟来看看在这种情况下p值会发生什么(理论上它们应该均匀分布):
> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )
1-sample proportions test with continuity correction
data: sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
0.07824054 0.08161183
sample estimates:
p
0.07991
显然,这比应有的拒绝频率更高,并且零假设是错误的(这与分布相等,但不匹配prob = 0.5)。
如果您比较基于Efron骰子的总体,则关于X> Y的概率的思考也会遇到一些有趣的问题。
曼恩·惠特尼(Mann-Whitney)对均值相等的方差变化不敏感,但是它可以-如您以形式看到的那样,检测导致偏离差异(例如均值和方差一起增加)。很显然,如果您有两个均值相等的法线,则它们的差是对称于零的。因此,,这是空情况。
例如,如果您的的指数分布的平均值为而的指数分布的平均值为(比例变化),则Mann-Whitney对此很敏感(实际上,取两边的对数,它只是一个位置偏移,并且Mann-Whitney不受单调变换的影响)。
-
如果您对概念上与曼恩·惠特尼(Mann-Whitney)非常相似且对中位数均等情况下的价差差异敏感的测试感兴趣,则有几种此类测试。
例如,有Siegel-Tukey检验和Ansari-Bradley检验,两者都与Mann-Whitney-Wilcoxon两次样品检验密切相关。
它们都是基于从头到尾排名的基本思想。
如果使用R,则内置Ansari-Bradley测试... ?ansari.test
实际上,Siegel-Tukey只是对从样本计算得出的等级进行了Mann-Whitney-Wilcoxon检验;如果您自己对数据进行排名,则实际上不需要为p值使用单独的函数。不过,您可以在此处找到一些内容:
-
(关于ttnphns在我的原始答案下的评论)
您可能会过度解释我的回应,以任何特别的实质性意义来阅读它与@GregSnow不同意。在重点和内容上肯定存在一定的差异,但是如果背后有很多真正的分歧,我会感到非常惊讶。
让我们报价Mann和惠特尼:“一个统计取决于相对行列的和的建议用于测试假设。 ”这是明确的; 它完全支持@GregSnow的位置。
现在,让我们看一下统计的构造方式:“ 让计算在之前的次数。 ”现在,如果它们的null为true,则该事件的概率为 ...但是还有其他方法可以得出0.5的概率,从这个意义上讲,人们可能会认为该测试可以在其他情况下运行。就他们估计 >的(重新定标)概率而言,它支持了我所说的。
但是,为了确保显着性水平正确无误,您需要的分布与空分布相匹配。这是基于这样的假设,即在空值下和组标签标签对组合观察的所有排列均具有同等可能性。在下肯定是这种情况。就像@GregSnow所说的。
问题是这种情况的严重程度(即,检验统计量的分布与在或近似等于的假设下得出的分布吻合),对于更普遍表示为null的情况。
我相信在很多情况下都可以。特别是对于包括但不如您所描述的情况在内的情况(两个具有相同均值但方差极不相等的正态总体可以在不改变基于等级的结果分布的情况下进行相当大的推广),我相信检验统计量的分布事实证明它具有相同的分布,因此应该在此处有效。我做了一些模拟来证明这一点。但是,它并不总是一个非常有用的测试(它的功能可能很差)。
我没有提供证明是这种情况。我已经应用了一些直觉/手挥舞的论点,并且还做了一些基本的模拟,证明了这是事实–与。
随便怎么做,但我不认为这是与@GregSnow的实质性分歧
the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation
?所以,您不同意@Greg的回答,对吗?