威尔科克森签名秩检验的适当性

11

我在“交叉验证”档案中打了一下，似乎找不到我的问题的答案。我的问题如下：Wikipedia给出了Wilcoxon签名等级测试需要保留的三个假设（针对我的问题稍作修改）：

令Zi = Xi-Yi，i = 1，...，n。

假设差异Zi是独立的。
（a。）每个Zi都来自相同的连续种群，并且（b。）每个Zi都是关于一个共同的中位数对称的；
Xi和Yi表示的值是有序的...因此比较“大于”，“小于”和“等于”是有用的。

但是，R中的？wilcox.test文档似乎表明（2.b）实际上是由该过程测试的：

“ ...如果x和y都给出且配对为TRUE，则执行x y的分布（在成对的两个样本的情况下）关于mu对称的null的Wilcoxon有符号秩检验。”

这个声音以我，好像该测试为零假设，即“Z是symetrically周围分布中值亩= SomeMu”执行-使得拒绝FO空可能是要么拒绝的对称性或拒绝其围绕该亩Z是对称的SomeMu。

这是对wilcox.test R文档的正确理解吗？当然，这很重要的原因是，我正在对一些前后数据（上面的“ X”和“ Y”）进行许多成对差异测试。“之前”和“之后”数据分别高度偏斜，但差异几乎没有偏斜（尽管仍然有些偏斜）。我的意思是，单独考虑的“之前”或“之后”数据的偏斜度约为7到21（取决于我正在查看的样本），而“差异”数据的偏斜度约为0.5到5。但没有那么多。

如果我的“差异”数据中存在偏斜会导致Wilcoxon检验给我错误/偏见的结果（如Wikipedia文章所表明的那样），那么偏斜可能是一个大问题。但是，如果Wilcoxon检验实际上是在检验差异分布是否“关于mu = SomeMu对称”（正如？wilcox.test似乎表明的那样），那么就不必担心了。

因此，我的问题是：

上面哪种解释是正确的？我的“差异”分布中的偏斜度会偏向我的Wilcoxon检验吗？
如果偏斜是一个问题，那就：“偏斜多少？”
如果在这里Wilcoxon签署的等级测试似乎非常不合适，那么我应该使用什么建议？

非常感谢。如果您对如何进行此分析有任何进一步的建议，我很高兴听到他们的声音（尽管我也可以为此目的打开另一个线程）。另外，这是我关于交叉验证的第一个问题；如果您对我的提问方式有任何建议/评论，我也欢迎您！

一些背景知识：我正在分析一个数据集，其中包含对我称之为“公司生产中的错误”的观察。我对意外检查前后在生产过程中发生的错误进行了观察，分析的目的之一是回答以下问题：“检查是否会显着减少错误的发生？”

数据集如下所示：

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

大约有4000个观测值。其他变量是描述公司特征的分类观察。规模可以小，中或大，每个公司都是其中之一，并且只有其中之一。企业可以是任何一种或所有“类型”。

我被要求进行一些简单的测试，以查看在检查所有公司和各个子组（基于大小和类型）之前和之后观察到的错误率是否存在统计学上的显着差异。之所以进行T检验，是因为数据在R之前和之后都严重偏斜，例如，在R中，之前的数据看起来像这样：

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

（这些都是伪造的-恐怕由于专有/隐私问题，我无法发布实际数据或对其进行任何实际操作-抱歉！）

配对的差异更集中，但仍不能很好地满足正态分布-太高了。差异数据如下所示：

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

有人建议我使用Wilcoxon签名等级测试，并在短暂浏览？wilcox.test和Wikipedia之后，在这里，这似乎是要使用的测试。考虑到以上假设，考虑到数据生成过程，我认为（1）很好。假设（2.a）对于我的数据而言并非完全正确，但此处的讨论是：当分布不连续时，Wilcoxon检验的替代方法？似乎表明这不是一个太大的问题。假设（3）很好。我唯一的担心（我相信）是假设（2.b）。

几年后，另外一个便条是：我最终参加了出色的非参数统计课程，并花了很多时间进行秩和检验。在假设（2.a）中，“每个Zi来自相同的连续种群”的思想是，两个样本均来自具有均等方差的种群- 实际上，这非常重要。如果您担心总体上的方差不同（从中抽取样本），则应考虑使用WMW。

r hypothesis-testing

— CompEcon
source

感谢您的两个答案！他们俩都相当平等地帮助了我。如果可以的话，我会“选择两者”。迈克（Mike）向我指出了一些理论上的理解，尽管Aniko的回答更直接地回答了我的原始问题，但从概念上讲还是很有帮助的。感谢你们俩！

— CompEcon 2011年

8

Wikipedia误导您说“ ...如果x和y都给出并且配对为TRUE，则对Wi-xon有符号秩检验，即x-y的分布...（在成对的两个样本中）是对称的大约亩。”

$z_i = x_i - y_i$

$\ln(x_i)$ $\ln(y_i)$

我？我会同时做，还有其他我能做得到的事情（按公司规模对泊松计数进行似然比检验？）。假设检验是关于确定证据是否令人信服的，有些人拿了很多说服力。

— 迈克·安德森
source

嗯，这很有意义。特别是现在我回到家，拿出旧的DeGroot＆Schervish教科书，其中对这些符号测试的实际作用进行了很好的描述。太棒了感谢您对假设检验的一般想法：）我喜欢这种观点。一个小注意事项：您注意到的令人误解的部分实际上来自wilcox.test文档中的R。这让我有些烦恼……

— CompEcon 2011年

9

Wikipedia和R帮助页面都是正确的，它们试图陈述同一件事，只是用不同的措词。

Wikipedia文章指出假设为（median = 0）vs（median！= 0），并说如果差异具有对称分布（+其他假设），则可以从检验中得出结论。

R帮助页面更具体，它表示假设为（中位数= 0，并且差异具有对称分布）vs（至少其中之一为假）。因此，它把一个假设转移到了原假设中。我认为他们这样做是为了强调对称性的必要性：即使存在中间值，即使存在偏差，带符号秩检验也会拒绝原假设。如果您读一本教科书，它也可能告诉您所检验的原假设为P（X> Y）= 0.5-其余的实际上就是从中得出的。

在应用方面，问题当然是您是否特别在意中位数（然后偏度是一个问题，中位数检验是一种可能的选择），还是在意整个分布，然后是P（X> y）！= 0.5是变化的证据。

— 安妮子
source

1

好的，这很有道理。感谢您的输入！我注意到中值测试的Wikipedia页面上说，首选不配对的Mann-Whitney-U测试。这立即让我觉得我有点退缩，以为配对的Wilcoxon测试以某种方式使用了更多信息。当我说“特别关心中位数...或整个分布”时，也许是我真正想想的。我关心的整个分布，但我通过表征中位数吧..

— CompEcon