假定一个单样本t检验,其中,所述零假设为。统计是然后吨= ‾ X - μ 0使用样本标准差s。在估计小号,一个观测比较样本均值¯X:
。
然而,如果我们假设在给定是真实的,人们也可以估算标准偏差小号*使用μ 0,而不是样本均值¯ X:
。
对我来说,这种方法看起来更自然,因为我们因此也将原假设用于估计SD。有谁知道测试中是否使用了所得统计量,或者为什么不知道?
假定一个单样本t检验,其中,所述零假设为。统计是然后吨= ‾ X - μ 0使用样本标准差s。在估计小号,一个观测比较样本均值¯X:
。
然而,如果我们假设在给定是真实的,人们也可以估算标准偏差小号*使用μ 0,而不是样本均值¯ X:
。
对我来说,这种方法看起来更自然,因为我们因此也将原假设用于估计SD。有谁知道测试中是否使用了所得统计量,或者为什么不知道?
Answers:
这篇文章中的原始模拟存在问题,希望现在可以解决。
当平均值偏离μ时,样本标准偏差的估计值会随着分子而增加,事实证明这不是对权力的“典型”的显着性水平都那么大的影响,因为在中型到大型的样品,小号* / √仍然倾向于足够大以至于无法接受。但是,在较小的样本中,它可能会产生一些影响,并且在非常小的显着性水平下,这可能会变得非常重要,因为它将使功效的上限小于1。
第二个问题,在“通用”显着性水平上可能更重要,似乎是检验统计量的分子和分母不再独立于零(平方的平方)。 与方差估计相关)。
这意味着测试在null下不再具有t分布。这不是致命的缺陷,但这意味着您不能只使用表并获得所需的重要性级别(我们将在稍后看到)。也就是说,测试变得保守,这会影响功率。
当n变大时,这种依赖性就不再是问题(尤其是因为您可以为分子调用CLT并使用Slutsky定理说,修改后的统计量没有渐近正态分布)。
您可以看到功效曲线较低(在较小的样本量下,它会变得更糟),但这似乎主要是因为分子与分母之间的依赖性降低了显着性水平。如果适当地调整临界值,即使在n = 10时,它们之间也几乎没有。
这表明,在非小样本量下,只要您不需要使用非常小的显着性水平,它们之间就没有那么多了。