如何在符号测试和Wilcoxon符号秩测试之间进行选择?


11

我正在尝试从这两个测试中选择一个来分析配对数据。有谁知道一般选择哪个规则的经验法则?


银鱼的答案在那里(几乎)触及它。这个问题很笼统,我想知道我们是否能够容忍一个更具体的问题。
Glen_b-恢复莫妮卡2015年

谢尔顿(Sheldon)-带符号的等级测试假设一个关于差异对称性的假设,而不是带符号的测试。另一方面,如果存在对称性且尾巴不是很重,则带符号的等级应具有更大的功效。
Glen_b-恢复莫妮卡2015年

我同意。在我的情况下,秩和检验的p值最大,正负号检验为中等,正负号检验最小。因此,它具有更大的力量。
谢尔顿

@Sheldon不,这不是您确定测试具有更大功效的方式-相对于一个样品而言,较低的p值可能仅仅是由于该样品的变异性,而功效是关于从同一样品中抽取的所有随机样品的行为人口。我最好写一个回答,扩展前面的评论,解释拥有更多权力的含义,并解释在每种情况下可能会做得更好的一些情况。
Glen_b-恢复莫妮卡2015年

3
@Glen_b,我要说的是,当前最重要的考虑因素是对将来的读者最有帮助。我认为无论是谁寻找符号测试与Wilcoxon测试并找到该线程,从这里阅读您的特定答案都会比从重定向到可能会迷路而永远找不到任何答案的大线程中受益更多。
变形虫

Answers:


9

我正在尝试从这两个测试中选择一个来分析配对数据。有谁知道一般选择哪个规则的经验法则?

有符号秩检验假设了零符号下不需要的差异对称性假设。(该假设是必要的,这样才能使无符号的差异等级所附加的符号排列的可能性相同。)

另一方面,如果总体中具有近似对称性并且尾巴不是很重,则带符号的等级应该具有更大的功效。

[不应以此为根据在样本中进行选择。通常,这会导致测试属性与名义属性不同(测试可能有偏差,实际显着性水平不再是它们看起来的样子,计算出的p值并不代表真实的p值,依此类推)。相反,应在可能的情况下,根据测试所用样本的外部知识来评估特征-是否通过主题领域知识,对此类数据集的熟悉程度,样本分解等...]

在我的情况下,秩和检验的p值最大,正负号检验为中等,正负号检验最小。因此,它具有更大的力量。

这并不是您认为测试具有更高功效的方式-相对于一个样本而言,较低的p值可能仅是由于该样本的变异性所致,而功效是关于从同一总体抽取的所有随机样本的行为。

就是说,假设您正在处理某些特定情况,其中成对差异的总体中心距0较远(即以特定方式为假)。然后,在相同条件(包括样本大小)下重复采样,功效将是该特定总体的拒绝率。H0

以类似的方式,我们可以计算出具有成对差异的不同位置*的总体序列的拒绝率,并获得整个幂曲线。然后,对于一个放置在另一个测试之上的测试,“更高的功率”将对应于整个功率曲线(或几乎所有功率曲线,请注意两者均应处于相同的显着性水平)。

*您可以将其作为当前讨论的中位数-而有符号秩检验的估计量是成对差异的成对平均值的中位数,在对称假设下,位置估计量也应该是中位数对的合适估计区别。


这是一个相关的问题,如何在小样本的t检验或非参数检验(例如Wilcoxon)之间进行选择。答案之一包括对本问题的(简短)讨论。


感谢您的澄清。我认为最重要的提示信息是关于符号秩检验的差异对称性的假设,在我的案例中这是违背的。我有一种感觉,除了检查对称性标准是否满足之外,没有其他方法可以判断哪个测试是错误的。相反,说哪个更合适听起来很合理。
谢尔顿

1
@Sheldon如果您不确定测试条件是否接近真实,通常不应该假设它们是正确的。也就是说,也许符号测试会是一个更好的主意。我希望有机会在我的答案中添加更多信息。
Glen_b-恢复莫妮卡2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.