我在“交叉验证”档案中打了一下,似乎找不到我的问题的答案。我的问题如下:Wikipedia给出了Wilcoxon签名等级测试需要保留的三个假设(针对我的问题稍作修改):
令Zi = Xi-Yi,i = 1,...,n。
假设差异Zi是独立的。
(a。)每个Zi都来自相同的连续种群,并且(b。)每个Zi都是关于一个共同的中位数对称的;
Xi和Yi表示的值是有序的...因此比较“大于”,“小于”和“等于”是有用的。
但是,R中的?wilcox.test文档似乎表明(2.b)实际上是由该过程测试的:
“ ...如果x和y都给出且配对为TRUE,则执行x y的分布(在成对的两个样本的情况下)关于mu对称的null的Wilcoxon有符号秩检验。”
这个声音以我,好像该测试为零假设,即“Z是symetrically周围分布中值亩= SomeMu”执行-使得拒绝FO空可能是要么拒绝的对称性或拒绝其围绕该亩Z是对称的SomeMu。
这是对wilcox.test R文档的正确理解吗?当然,这很重要的原因是,我正在对一些前后数据(上面的“ X”和“ Y”)进行许多成对差异测试。“之前”和“之后”数据分别高度偏斜,但差异几乎没有偏斜(尽管仍然有些偏斜)。我的意思是,单独考虑的“之前”或“之后”数据的偏斜度约为7到21(取决于我正在查看的样本),而“差异”数据的偏斜度约为0.5到5。但没有那么多。
如果我的“差异”数据中存在偏斜会导致Wilcoxon检验给我错误/偏见的结果(如Wikipedia文章所表明的那样),那么偏斜可能是一个大问题。但是,如果Wilcoxon检验实际上是在检验差异分布是否“关于mu = SomeMu对称”(正如?wilcox.test似乎表明的那样),那么就不必担心了。
因此,我的问题是:
上面哪种解释是正确的?我的“差异”分布中的偏斜度会偏向我的Wilcoxon检验吗?
如果偏斜是一个问题,那就:“偏斜多少?”
如果在这里Wilcoxon签署的等级测试似乎非常不合适,那么我应该使用什么建议?
非常感谢。如果您对如何进行此分析有任何进一步的建议,我很高兴听到他们的声音(尽管我也可以为此目的打开另一个线程)。另外,这是我关于交叉验证的第一个问题;如果您对我的提问方式有任何建议/评论,我也欢迎您!
一些背景知识:我正在分析一个数据集,其中包含对我称之为“公司生产中的错误”的观察。我对意外检查前后在生产过程中发生的错误进行了观察,分析的目的之一是回答以下问题:“检查是否会显着减少错误的发生?”
数据集如下所示:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
大约有4000个观测值。其他变量是描述公司特征的分类观察。规模可以小,中或大,每个公司都是其中之一,并且只有其中之一。企业可以是任何一种或所有“类型”。
我被要求进行一些简单的测试,以查看在检查所有公司和各个子组(基于大小和类型)之前和之后观察到的错误率是否存在统计学上的显着差异。之所以进行T检验,是因为数据在R之前和之后都严重偏斜,例如,在R中,之前的数据看起来像这样:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(这些都是伪造的-恐怕由于专有/隐私问题,我无法发布实际数据或对其进行任何实际操作-抱歉!)
配对的差异更集中,但仍不能很好地满足正态分布-太高了。差异数据如下所示:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
有人建议我使用Wilcoxon签名等级测试,并在短暂浏览?wilcox.test和Wikipedia之后,在这里,这似乎是要使用的测试。考虑到以上假设,考虑到数据生成过程,我认为(1)很好。假设(2.a)对于我的数据而言并非完全正确,但此处的讨论是:当分布不连续时,Wilcoxon检验的替代方法? 似乎表明这不是一个太大的问题。假设(3)很好。我唯一的担心(我相信)是假设(2.b)。
几年后,另外一个便条是:我最终参加了出色的非参数统计课程,并花了很多时间进行秩和检验。在假设(2.a)中,“每个Zi来自相同的连续种群”的思想是,两个样本均来自具有均等方差的种群- 实际上,这非常重要。如果您担心总体上的方差不同(从中抽取样本),则应考虑使用WMW。