威尔科克森签名秩检验的适当性


11

我在“交叉验证”档案中打了一下,似乎找不到我的问题的答案。我的问题如下:Wikipedia给出了Wilcoxon签名等级测试需要保留的三个假设(针对我的问题稍作修改):

令Zi = Xi-Yi,i = 1,...,n。

  1. 假设差异Zi是独立的。

  2. (a。)每个Zi都来自相同的连续种群,并且(b。)每个Zi都是关于一个共同的中位数对称的;

  3. Xi和Yi表示的值是有序的...因此比较“大于”,“小于”和“等于”是有用的。

但是,R中的?wilcox.test文档似乎表明(2.b)实际上是由该过程测试的:

“ ...如果x和y都给出且配对为TRUE,则执行x y的分布(在成对的两个样本的情况下)关于mu对称的null的Wilcoxon有符号秩检验。”

这个声音以我,好像该测试为零假设,即“Z是symetrically周围分布中值亩= SomeMu”执行-使得拒绝FO空可能是要么拒绝的对称性拒绝其围绕该亩Z是对称的SomeMu。

这是对wilcox.test R文档的正确理解吗?当然,这很重要的原因是,我正在对一些前后数据(上面的“ X”和“ Y”)进行许多成对差异测试。“之前”和“之后”数据分别高度偏斜,但差异几乎没有偏斜(尽管仍然有些偏斜)。我的意思是,单独考虑的“之前”或“之后”数据的偏斜度约为7到21(取决于我正在查看的样本),而“差异”数据的偏斜度约为0.5到5。但没有那么多。

如果我的“差异”数据中存在偏斜会导致Wilcoxon检验给我错误/偏见的结果(如Wikipedia文章所表明的那样),那么偏斜可能是一个大问题。但是,如果Wilcoxon检验实际上是在检验差异分布是否“关于mu = SomeMu对称”(正如?wilcox.test似乎表明的那样),那么就不必担心了。

因此,我的问题是:

  1. 上面哪种解释是正确的?我的“差异”分布中的偏斜度会偏向我的Wilcoxon检验吗?

  2. 如果偏斜一个问题,那就:“偏斜多少?”

  3. 如果在这里Wilcoxon签署的等级测试似乎非常不合适,那么我应该使用什么建议?

非常感谢。如果您对如何进行此分析有任何进一步的建议,我很高兴听到他们的声音(尽管我也可以为此目的打开另一个线程)。另外,这是我关于交叉验证的第一个问题;如果您对我的提问方式有任何建议/评论,我也欢迎您!


一些背景知识:我正在分析一个数据集,其中包含对我称之为“公司生产中的错误”的观察。我对意外检查前后在生产过程中发生的错误进行了观察,分析的目的之一是回答以下问题:“检查是否会显着减少错误的发生?”

数据集如下所示:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

大约有4000个观测值。其他变量是描述公司特征的分类观察。规模可以小,中或大,每个公司都是其中之一,并且只有其中之一。企业可以是任何一种或所有“类型”。

我被要求进行一些简单的测试,以查看在检查所有公司和各个子组(基于大小和类型)之前和之后观察到的错误率是否存在统计学上的显着差异。之所以进行T检验,是因为数据在R之前和之后都严重偏斜,例如,在R中,之前的数据看起来像这样:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(这些都是伪造的-恐怕由于专有/隐私问题,我无法发布实际数据或对其进行任何实际操作-抱歉!)

配对的差异更集中,但仍不能很好地满足正态分布-太高了。差异数据如下所示:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

有人建议我使用Wilcoxon签名等级测试,并在短暂浏览?wilcox.test和Wikipedia之后,在这里,这似乎是要使用的测试。考虑到以上假设,考虑到数据生成过程,我认为(1)很好。假设(2.a)对于我的数据而言并非完全正确,但此处的讨论是:当分布不连续时,Wilcoxon检验的替代方法? 似乎表明这不是一个太大的问题。假设(3)很好。我唯一的担心(我相信)是假设(2.b)。

几年后,另外一个便条是:我最终参加了出色的非参数统计课程,并花了很多时间进行秩和检验。在假设(2.a)中,“每个Zi来自相同的连续种群”的思想是,两个样本均来自具有均等方差的种群- 实际上,这非常重要。如果您担心总体上的方差不同(从中抽取样本),则应考虑使用WMW。


感谢您的两个答案!他们俩都相当平等地帮助了我。如果可以的话,我会“选择两者”。迈克(Mike)向我指出了一些理论上的理解,尽管Aniko的回答更直接地回答了我的原始问题,但从概念上讲还是很有帮助的。感谢你们俩!
CompEcon 2011年

Answers:


8

Wikipedia误导您说“ ...如果x和y都给出并且配对为TRUE,则对Wi-xon有符号秩检验,即x-y的分布...(在成对的两个样本中)是对称的大约亩。”

zi=xiyi

ln(xi)ln(yi)

我?我会同时做,还有其他我能做得到的事情(按公司规模对泊松计数进行似然比检验?)。假设检验是关于确定证据是否令人信​​服的,有些人拿了很多说服力。


嗯,这很有意义。特别是现在我回到家,拿出旧的DeGroot&Schervish教科书,其中对这些符号测试的实际作用进行了很好的描述。太棒了 感谢您对假设检验的一般想法:)我喜欢这种观点。一个小注意事项:您注意到的令人误解的部分实际上来自wilcox.test文档中的R。这让我有些烦恼……
CompEcon 2011年

9

Wikipedia和R帮助页面都是正确的,它们试图陈述同一件事,只是用不同的措词。

Wikipedia文章指出假设为(median = 0)vs(median!= 0),并说如果差异具有对称分布(+其他假设),则可以从检验中得出结论。

R帮助页面更具体,它表示假设为(中位数= 0,并且差异具有对称分布)vs(至少其中之一为假)。因此,它把一个假设转移到了原假设中。我认为他们这样做是为了强调对称性的必要性:即使存在中间值,即使存在偏差,带符号秩检验也会拒绝原假设。如果您读一本教科书,它也可能告诉您所检验的原假设为P(X> Y)= 0.5-其余的实际上就是从中得出的。

在应用方面,问题当然是您是否特别在意中位数(然后偏度是一个问题,中位数检验是一种可能的选择),还是在意整个分布,然后是P(X> y)!= 0.5是变化的证据。


1
好的,这很有道理。感谢您的输入!我注意到中值测试的Wikipedia页面上说,首选不配对的Mann-Whitney-U测试。这立即让我觉得我有点退缩,以为配对的Wilcoxon测试以某种方式使用了更多信息。当我说“特别关心中位数...或整个分布”时,也许是我真正想想的。我关心的整个分布,但我通过表征中位数吧..
CompEcon
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.