我知道非参数依赖于中位数而不是均值
在这种意义上,几乎没有任何非参数检验实际上“依赖”中位数。我只能想到一对...我希望您甚至可能听说过的唯一一个就是符号测试。
比较...某物。
如果他们依靠中位数,大概是比较中位数。但是,尽管有许多资料试图告诉您,但像有符号秩检验或Wilcoxon-Mann-Whitney或Kruskal-Wallis之类的检验根本不是对中位数的检验。如果您做出其他一些假设,则可以将Wilcoxon-Mann-Whitney和Kruskal-Wallis视为中位数的检验,但是在相同的假设下(只要存在分布均值),您同样可以将它们视为均值检验。
与Signed Rank检验相关的实际位置估计值是样本内成对平均值的中位数,Wilcoxon-Mann-Whitney的平均值(并暗示,在Kruskal-Wallis中)是样本间成对差异的中值。
我也相信它依赖于“自由度?” 而不是标准偏差。如果我错了,请纠正我。
大多数非参数测试没有“自由度”,尽管许多分布随样本大小而变化,并且在表随样本大小变化的意义上,您可能认为这有点像自由度。样本当然确实保留了它们的属性,并且在那个意义上具有n个自由度,但是测试统计量的分布中的自由度通常与我们无关。您可能会遇到一些更像自由度的事-例如,您肯定会提出一个论点,即Kruskal-Wallis确实具有与卡方基本相同的意义上的自由度,但通常不会关注这样(例如,如果有人在谈论克鲁斯瓦尔-沃利斯的自由度,他们几乎总是指df
关于自由度的很好的讨论可以在这里找到/
我已经进行了相当不错的研究,或者我想尝试理解该概念,其背后的工作原理,测试结果的真正含义,以及/或者甚至对测试结果进行处理。但是似乎没人敢涉足这一领域。
我不确定您的意思。
我可以建议一些书,例如Conover的《实用非参数统计》,如果可以的话,可以推荐Neave和Worthington的书(无分布测试),但是还有很多其他书-例如Marascuilo和McSweeney,Hollander和Wolfe或Daniel的书。我建议您阅读至少3或4个最能说明您问题的书籍,最好是那些解释尽可能不同的书籍(这意味着至少要阅读6或7本书中的一小部分才能找到适合自己的3本书)。
为了简单起见,让我们坚持使用曼恩·惠特尼(Mann Whitney U)测试,我注意到它很受欢迎
就是这样,这让我感到困惑,因为您的陈述“似乎没有人冒险进入该区域”-许多使用这些测试的人确实“冒险进入”您所谈论的区域。
-并且似乎也被滥用和过度使用
我想说的是,如果有任何东西(包括Wilcoxon-Mann-Whitney),非参数测试通常会被利用不足 -尤其是置换/随机化测试,尽管我不必质疑它们经常被滥用(但是参数测试也是如此)更多)。
假设我对我的数据进行了非参数测试,然后得到了以下结果:
[片段]
我熟悉其他方法,但是这里有什么不同?
您还说其他哪些方法?您希望我将此与之进行比较吗?
编辑:您稍后提到回归;假设您熟悉两个样本的t检验(因为这确实是回归的一种特殊情况)。
在普通的两样本t检验的假设下,零假设是两个总体是相同的,而另一种情况是分布之一发生了变化。如果您查看下面的Wilcoxon-Mann-Whitney的两组假设中的第一个,则那里要测试的基本事物几乎是相同的。只是t检验是基于假设样本来自相同的正态分布(除了可能的位置偏移)。如果原假设为真,并且伴随的假设为真,则检验统计量具有t分布。如果替代假设为真,则检验统计量更有可能采用看起来与零假设不一致但与替代假设一致的值-我们着重研究最不寻常的
Wilcoxon-Mann-Whitney的情况非常相似,但是它测量与零值的偏差有些不同。实际上,当t检验的假设为true *时,它几乎与最佳检验(t检验)一样好。
*(实际上从来没有,尽管听起来并不像问题那么严重)
确实,可以将Wilcoxon-Mann-Whitney视为对数据等级进行的“ t检验”,尽管它没有t分布。统计信息是根据数据等级计算的两个样本t统计量的单调函数,因此它在样本空间上引起相同的排序**(即对等级进行“ t检验”-适当执行-会产生与Wilcoxon-Mann-Whitney相同的p值),因此它会拒绝完全相同的情况。
**(严格来说,是部分订购,但让我们撇开它)
[您认为仅使用等级会丢弃大量信息,但是当从具有相同方差的正常总体中提取数据时,几乎所有有关位置偏移的信息都在等级模式中。实际数据值(取决于其等级)为此添加的信息很少。如果您的尾巴比平时重,那么不久前Wilcoxon-Mann-Whitney检验将具有更好的功效,并保持其名义上的显着性水平,因此,排名上方的“额外”信息最终不仅会变得无用,而且在某些情况下意识,误导。但是,近对称的重尾现象很少见。在实践中经常看到的是偏度。]
基本思想非常相似,p值具有相同的解释(如果原假设为真,则结果的概率为或更极端)-如果您做出以下解释,则直接解释为位置偏移必要的假设(请参阅本文末尾有关假设的讨论)。
如果我进行了与上述用于t检验的图相同的模拟,则图看起来会非常相似-x和y轴上的比例看起来会有所不同,但是基本外观会相似。
我们是否应该希望p值小于0.05?
您不应该在那里“想要”任何东西。这样做的目的是找出样本(在位置上)是否比偶然解释的更多,而不是“希望”特定的结果。
如果我说“你可以去看看颜色Raj的车是什么吗?”,如果我想它的一个公正的评估,我不希望你是想“伙计,我真的,真的希望它是蓝色!它只是有要蓝色”。最好只是看看情况如何,而不是参加一些“我需要它成为某种东西”。
如果您选择的显着性水平为0.05,则当p值低于0.05时,您将拒绝原假设。但是,如果您有足够大的样本量来几乎总是检测到相关的效应量,那么拒绝失败至少同样有趣,因为这表明存在的任何差异都很小。
“曼·惠特利”数字是什么意思?
Mann-Whitney 统计量。
与零假设为真时(见上图)可以取的值的分布相比,它仅是有意义的(这取决于任何特定程序可以使用几个特定定义中的哪个)。
有什么用吗?
通常,您并不关心这样的确切值,而是它位于零分布中(无论它是或多或少代表零假设成立时应该看到的典型值,还是更极端)
P(X<Y)
这里的数据是否只是验证或不验证是否应使用我拥有的特定数据源?
该测试没有说明“我应该或不应该使用的特定数据源”。
请参阅下面有关查看WMW假设的两种方式的讨论。
我在回归和基础知识方面有相当丰富的经验,但对这种“特殊”非参数化的东西非常好奇
对于非参数检验,没有什么特别的要求(我想说“标准”检验在许多方面都比典型的参数检验更为基础),只要您真正了解假设检验即可。
但是,这可能是另一个问题的话题。
有两种主要方法可以查看Wilcoxon-Mann-Whitney假设检验。
i)一个是说“我对位置偏移很感兴趣-也就是说,在原假设下,两个总体具有相同(连续)的分布,而另一种选择是相对于该位置“上移”或“下移”其他”
如果做出此假设,Wilcoxon-Mann-Whitney的效果会很好(您的选择只是位置偏移)
在这种情况下,Wilcoxon-Mann-Whitney实际上是对中位数的检验……但同样地,它是对均值的检验,或者实际上是对任何其他位置等值统计量的检验(例如,第90个百分位数或修整后的均值,或任意数量的其他事物),因为它们都受到位置偏移的相同影响。
这样做的好处是,它很容易解释-而且很容易为该位置偏移生成一个置信区间。
但是,Wilcoxon-Mann-Whitney检验对除位置偏移以外的其他种类的差异敏感。
1个21个2