排列检验:选择检验统计量的条件


9

我经常使用排列测试,并且喜欢它们的简单性。我从Good所著的《重采样方法》一书中学到了很多东西,其中作者在整个示例中选择测试统计数据时似乎很有创造力。同样,该帖子给人的印象是,可以很大程度地选择测试统计信息。

我确实想知道测试统计量是否符合理论要求。还是只要可以直观地使用并且具有良好的I / II类型错误率的统计量,我们就可以使用它吗?

例如,当由于非正态总体而使用置换检验而不是t检验时,我已经看到很多次仍然从t统计量获得置换检验p值。尽管不一定是错误的,但考虑到Student t分布的起源,这似乎是一个奇怪的选择。

Answers:


8

t统计量作为检验统计量很有意义;许多人觉得它很直观。如果我引用的t统计量为0.5或5.5,它会告诉您一些信息-除均值外还有多少标准误。

使用统计量的困难-至少在中等非正态性方面-与其说是统计量,不如说是在零值下使用t分布进行统计。该统计数字非常合理。

当然,如果您期望尾部比正常情况重得多,则更健壮的统计数据会做得更好,但是t统计量对偏离正常度的轻微偏差并不高度敏感(例如,它比方差比率统计量的敏感性低)。

如果您只想使用统计的分子,那就太好了,如果您对均值的变化感兴趣,那么将其作为排列统计就非常有意义了。如果您对更一般的位置偏移感兴趣,那么它将带来很多其他可能性。

您认为正确的统计数据有很多自由,可以根据特定情况对其进行调整-您想要针对哪些替代方法,或者希望解决哪些可能的问题(例如,污染可以冲击功率)。

几乎没有任何限制-您可以自由选择几乎所有内容,包括无用的测试统计信息。当然,在选择测试时,您确实应该考虑一些注意事项,但是您可以随意选择。

-

也就是说,有些标准可以在各种情况下应用。

例如,如果您对特定类型的假设特别感兴趣,则可以使用反映该假设的统计数据-例如,如果您要检验总体均值的差异,则通常使检验统计数据有意义与样本均值的差异有关。

如果您对可能的分布类型有所了解-重尾,偏斜,或者概念上轻尾但带有一定程度的污染或双峰,...您可以设计一个测试统计量,在这种情况下可能会很好,例如,选择一个在预期情况下应表现良好但对污染具有一定鲁棒性的统计数据。

-

仿真是研究各种情况下功率的一种方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.