不等方差条件下的Mann-Whitney零假设


9

我只是对Mann-Whitney U检验的零假设感到好奇。我经常看到它指出零假设是两个总体具有相等的分布。但是我在想-如果我有两个均值相同但方差极不相等的正常群体,则Mann-Whitney检验可能不会检测到这种差异。

我还看到它表明曼·惠特尼检验的原假设是或一个总体(X)的观察结果超过第二总体(Y)的观察结果的概率(在排除并列)等于0.5。这似乎更有意义,但似乎不等同于我陈述的第一个零假设。Pr(X>Y)=0.5XY

我希望能对此有所帮助。谢谢!

Answers:


5

Mann-Whitney检验是置换检验的一种特殊情况(通过查看所有可能的数据置换得出零值下的分布),并且置换检验将零值视为相同的分布,因此在技术上是正确的。

曼恩·惠特尼检验统计量的一种思考方式是衡量一组随机选择的值超过另一组随机选择的值的次数。因此P(X> Y)= 0.5也是有道理的,并且从技术上讲,这是等分分布为null的一个属性(假设出现平局概率为0的连续分布)。如果2个分布相同,则X大于Y的概率为0.5,因为它们都是从相同的分布中得出的。

所陈述的2个分布具有相同的均值但方差差异很大的情况与第二个无效假设相匹配,但与第一个相同的分布不匹配。我们可以做一些模拟来看看在这种情况下p值会发生什么(理论上它们应该均匀分布):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

显然,这比应有的拒绝频率更高,并且零假设是错误的(这与分布相等,但不匹配prob = 0.5)。

如果您比较基于Efron骰子的总体,则关于X> Y的概率的思考也会遇到一些有趣的问题。


嗨,格雷格,谢谢你的回答。听起来您在说什么,是我发现某种特殊情况,即在相等分布为null的情况下测试无法正常工作。而且,我所说的原假设不相等。那是对的吗?
Jimj 2013年

4

曼恩·惠特尼(Mann-Whitney)对均值相等的方差变化不敏感,但是它可以-如您以形式看到的那样,检测导致偏离差异(例如均值和方差一起增加)。很显然,如果您有两个均值相等的法线,则它们的差是对称于零的。因此,,这是空情况。P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

例如,如果您的的指数分布的平均值为而的指数分布的平均值为(比例变化),则Mann-Whitney对此很敏感(实际上,取两边的对数,它只是一个位置偏移,并且Mann-Whitney不受单调变换的影响)。Y1Xk

-

如果您对概念上与曼恩·惠特尼(Mann-Whitney)非常相似且对中位数均等情况下的价差差异敏感的测试感兴趣,则有几种此类测试。

例如,有Siegel-Tukey检验和Ansari-Bradley检验,两者都与Mann-Whitney-Wilcoxon两次样品检验密切相关。

它们都是基于从头到尾排名的基本思想。

如果使用R,则内置Ansari-Bradley测试... ?ansari.test

实际上,Siegel-Tukey只是对从样本计算得出的等级进行了Mann-Whitney-Wilcoxon检验;如果您自己对数据进行排名,则实际上不需要为p值使用单独的函数。不过,您可以在此处找到一些内容:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(关于ttnphns在我的原始答案下的评论)

您可能会过度解释我的回应,以任何特别的实质性意义来阅读它与@GregSnow不同意。在重点和内容上肯定存在一定的差异,但是如果背后有很多真正的分歧,我会感到非常惊讶。

让我们报价Mann和惠特尼:“一个统计取决于相对行列的和的建议用于测试假设 ”这是明确的; 它完全支持@GregSnow的位置。Uxyf=g

现在,让我们看一下统计的构造方式:“ 让计算在之前的次数。Uyx ”现在,如果它们的null为true,则该事件的概率为 ...但是还有其他方法可以得出0.5的概率,从这个意义上讲,人们可能会认为该测试可以在其他情况下运行。就他们估计 >的(重新定标)概率而言,它支持了我所说的。12YX

但是,为了确保显着性水平正确无误,您需要的分布与空分布相匹配。这是基于这样的假设,即在空值下和组标签标签对组合观察的所有排列均具有同等可能性。在下肯定是这种情况。就像@GregSnow所说的。UXYf=g

问题是这种情况的严重程度(即,检验统计量的分布与在或近似等于的假设下得出的分布吻合),对于更普遍表示为null的情况。f=g

我相信在很多情况下都可以。特别是对于包括但不如您所描述的情况在内的情况(两个具有相同均值但方差极不相等的正态总体可以在不改变基于等级的结果分布的情况下进行相当大的推广),我相信检验统计量的分布事实证明它具有相同的分布,因此应该在此处有效。我做了一些模拟来证明这一点。但是,它并不总是一个非常有用的测试(它的功能可能很差)。

我没有提供证明是这种情况。我已经应用了一些直觉/手挥舞的论点,并且还做了一些基本的模拟,证明了这是事实–与。f=g

随便怎么做,但我不认为这是与@GregSnow的实质性分歧

参考-Mann&Whitney的原始论文


如果您同意Wikipedia的Mann-Whitney对话页面上的这句话,我是否理解正确the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation?所以,您不同意@Greg的回答,对吗?
ttnphns

我在编辑中添加了一些讨论。
Glen_b-恢复莫妮卡

非常好。我将对其进行研究(我一直觉得MW测试中的细微差别仍在继续困扰着我)。同时,如果我愿意,您是否同意:“由于MW检验统计量仅反映平均排名的(不平等),因此可能存在f〜= g [我将f,g理解为原始分布,先前的排名],但是该测试在继续处理与f = g下相同的H0时完全没有关系。这种情况的一个例子是对称分布完全相同,除了扩展参数(方差)”。
ttnphns

用记号(顺便说一下曼恩和惠特尼的),和是和的密度。我同意,在我已确认/理解情况的范围内,您的陈述似乎是事实。我怀疑曼恩·惠特尼还有很多东西让我难以理解。fgXY
Glen_b-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.