在什么情况下,Wilcoxon的符号秩检验优于t检验或符号检验?


10

经过一些讨论(在下面),我现在对焦点问题有了更清晰的了解,因此这是一个修订后的问题,尽管某些评论现在似乎与原始问题无关。

似乎t检验针对对称分布迅速收敛有符号秩检验假设对称,并且对于对称分布,均值/伪随机数/中位数之间没有差异。如果是这样,在什么情况下,当他/她同时拥有t检验和sign检验时,相对没有经验的统计学家会认为有序检验有用吗?如果我的一位(例如社会科学专业)学生正在尝试测试一种治疗方法是否比另一种治疗方法更好(通过某种相对容易解释的衡量标准,例如某种“平均”差异的概念),那么我将努力寻找一个有签名的地方,即使在我的大学中,虽然通常会进行等级考试,但忽略了符号测试。


1
Justme:当然,我没有考虑过。
JonB

1
这取决于您要看的是谁的传统知识;我的经历与您的经历大不相同。当然,很容易找到明确指出差值对称性假定为null的资源(这很重要)。但是请注意,这是零值 -结果是,发现样本中差异评分缺乏对称性不一定是相关的-在替代方法中,您不必具有对称性。如果您很有信心,如果null为真,那么对称性将成立-在许多情况下,这是一个非常合理的假设-... ctd
Glen_b -Reinstate Monica

1
ctd ...那么就没有问题了。问题是,如果您不准备事先假设,则不知道是否由于假设失败而导致了拒绝。那么,显而易见的事情就是根本不做假设。
Glen_b-恢复莫妮卡

2
首先查看您的第二条评论:(在您已经提到的内容之上),请注意1.正常的假设并不能用尽参数测试。2.有符号秩检验实际上不是对中位数的检验,而是对一个样本的Hodges-Lehmann统计数据/伪中位数的检验(尽管如果将对称性假设添加到替代方法中,它还将检验中位数,以及存在均值的地方,也包括经济手段)。同样,秩和检验不是中位数的检验,而是中位数成对差异的检验。没错,有符号秩测试的水平可能对不对称非常敏感。
Glen_b-恢复莫妮卡

2
关于您的早期评论:1对称性通常不被视为null的一部分,而是作为您需要的假设的一部分,以便可以在null下交换排列。2.如前所述,它实际上不是对中位数的检验,而是对伪中位数的检验,即使在非对称替代情况下也是如此。的确,如果您进行一些限制性假设,有时解释起来会更容易,但是对中位数进行合理检验所需的限制不必像在替代方案中假设对称性那样严格。
Glen_b-恢复莫妮卡

Answers:


3

考虑成对的差分分布,其尾部比正常情况下重一些,但不是特别的“尖峰”。那么带符号等级测试通常会比t检验更强大,但也比符号测试更强大。

例如,在逻辑分布中,有序秩检验相对于t检验的渐近相对效率为1.097,因此有序秩检验应比t更有力(至少在较大的样本中),但渐近相对效率符号测试相对于t检验的系数为0.822,因此符号测试的功能不如t强大(同样,至少在较大的样本中)。

当我们转向较重的尾部分布(同时仍避免过分尖锐的分布)时,t往往表现相对较差,而符号测试应有所改善,并且在检测较小的符号时,符号和符号秩均将胜过t有效影响(即,需要较小的样本量才能检测到影响)。将有一大类发行版,其秩次检验是这三种中最好的。

这是一个示例分布。对于三个测试,在n = 100时模拟了功率,显着性水平为5%。对于电源测试以黑色标记,这对于魏氏红色符号秩和符号检验被标记为绿色。手语测试的可用显着性水平不包括任何特别接近5%的水平,因此在这种情况下,使用随机测试来接近正确的显着性水平。x轴是参数,它表示从零值情况开始的偏移(测试都是双向的,因此实际功率曲线将对称于0)。t3tδ

t的幂曲线图,Wilcoxon有符号秩和符号检验,n = 100,t3的显着性水平为5%

正如我们在图中所看到的,有符号秩检验比有符号检验具有更高的功效,而有符号检验又比t检验具有更高的功效。


非常感谢这个@Glen_b!当我们有一些学生,甚至对于权力的概念也超出了他们的学习范围,以及为什么我们教威尔科克森作为配对t的主要替代方法时,我仍在努力确定它是否适合我们的教学大纲。但这确实提供了一些有用的动机。谢谢!
justme

顺便说一句,在考虑了什么分布特征影响中位数的渐近方差(以及符号检验的功效)之后,我想到一个例子,其中t和符号检验的相对位置相反。因此,我认为很有可能构建一个案例,即有符号秩检验可能比其他两个检验都好得多。如果可以,我会再玩一些,也许还会在上面写些东西。
Glen_b-恢复莫妮卡

就您的课程表而言,很明显,在某些情况下,带符号的等级肯定胜过其他两个测试(正如我在回答中所概述的那样-分布比正常情况有些拖尾,但不是特别高)。t在正常或较轻的情况下更好,而符号测试在分布具有很强的峰值时通常会更好(峰值往往伴随着很重的尾巴,但不一定如此)。[但是要注意,这些想法只不过是传播的变化而混淆,不会改变它们的相对特性。] ...我敢肯定,您可以在
Glen_b -Reinstate Monica

非常感谢@Glen_b!麻烦在于我不是在教教学大纲,只是在支持它!大多数部门的课程提纲似乎是:(i)使用正态性假设检验(立即杀死我),并基于此(ii)使用Wilcoxon或t-检验。因此,就算是满足假设(以某种垃圾的方式),也永远不会触及分布等细节的细节,权力也不会被触及。但是至少您个人的想法对我很有帮助!
justme

好帖子@Glen_b!因此,从两个测试中进行选择,我是否可以得出结论,我们应该始终首先计算功率?如果差异分布不正常,而不是遵循始终使用Sign Test的假设?谢谢!
Lumos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.