Answers:
您可以使用置信区间(CI)进行假设检验。在典型情况下,如果效果的CI不跨越0,那么您可以拒绝原假设。但是CI可以用于更多功能,而报告是否已通过CI是测试有用性的限制。
例如,建议您使用CI而不是仅使用t检验的原因是,因为这样您不仅可以检验假设,还可以做更多的事情。您可以声明您认为可能的影响范围(CI中的影响)。您不能仅通过t检验就能做到这一点。您还可以使用它来进行有关null的声明,而这是t检验无法做到的。如果t检验不拒绝空值,那么您只是说您不能拒绝空值,这说明不多。但是,如果您在null周围有狭窄的置信区间,则可以建议null或接近null的值可能是真实值,并建议处理效果或自变量太小而无意义(或者您的实验没有
稍后再添加: 我真的应该这么说,尽管您可以像测试一样使用CI,但事实并非如此。它是您认为参数值所在范围的估计。您可以像推论一样进行测试,但是永远不要以这种方式谈论它要好得多。
哪个更好?
A)影响为0.6,t(29)= 2.8,p <0.05。这种具有统计意义的影响是...(一些讨论随后就此统计意义进行了讨论,而没有提及甚至没有强大的能力来讨论该发现的大小的实际含义...在Neyman-Pearson框架下,t和p值几乎毫无意义,您可以讨论的是效果是否存在。您永远无法真正谈论基于测试的效果实际上没有。)
要么
B)使用95%的置信区间,我估计效果在0.2到1.0之间。(随后进行了一些讨论,讨论了利息的实际影响,是否有意义的值是否具有任何特定含义以及是否使用了有意义的词来确切地表明其含义。此外,配置项的宽度可以直接用于讨论这是一个很好的发现还是只能得出更初步的结论)
如果您参加了基础统计学课,则可能最初会偏向A。在某些情况下,这是报告结果的更好方法。但是对于大多数工作来说,B远比它优越。范围估计不是测试。
假设检验与置信区间之间存在等价关系。(请参见例如http://en.wikipedia.org/wiki/Confidence_interval#Statistical_hypothesis_testing)我将举一个非常具体的例子。假设我们从正态分布中得到样本,均值为,方差为1,我们将其写为。假设我们认为,我们要测试的零假设,在水平因此,我们进行检验统计,在这种情况下,我们将其作为样本平均值:。现在,假设是该测试的的“接受区域”。这意味着是的可能值的集合,其零假设被接受为0.05级(我将“已接受”用作“未拒绝”的简写-我不建议您认为原假设是正确的。)对于此示例,我们可以查看正态分布,并选择在该分布下概率至少为0.95的任何集合。现在,对于95%的置信区域是该组的所有针对是在。换句话说,它是所有的集合,对于该集合,观察假设的将接受零假设。这就是为什么约翰说“如果某项效果的CI没有跨越则可以拒绝原假设。”(John指的是检验。)