置信区间和假设检验之间有什么区别?


28

我已经读过关于假设检验的争议 ,一些评论员建议不要使用假设检验。一些评论员建议应改用置信区间

  • 置信区间和假设检验之间有什么区别?参考和示例的解释将是可理解的。

5
我想您想问一个问题,为什么通过显示置信区间来报告假设检验结果比仅在某些p值水平上确认或拒绝某件事更好。

3
您应该考虑检查其他一些已回答的问题。
安迪W

Answers:


19

您可以使用置信区间(CI)进行假设检验。在典型情况下,如果效果的CI不跨越0,那么您可以拒绝原假设。但是CI可以用于更多功能,而报告是否已通过CI是测试有用性的限制。

例如,建议您使用CI而不是仅使用t检验的原因是,因为这样您不仅可以检验假设,还可以做更多的事情。您可以声明您认为可能的影响范围(CI中的影响)。您不能仅通过t检验就能做到这一点。您还可以使用它来进行有关null的声明,而这是t检验无法做到的。如果t检验不拒绝空值,那么您只是说您不能拒绝空值,这说明不多。但是,如果您在null周围有狭窄的置信区间,则可以建议null或接近null的值可能是真实值,并建议处理效果或自变量太小而无意义(或者您的实验没有

稍后再添加: 我真的应该这么说,尽管您可以像测试一样使用CI,但事实并非如此。它是您认为参数值所在范围的估计。您可以像推论一样进行测试,但是永远不要以这种方式谈论它要好得多。

哪个更好?

A)影响为0.6,t(29)= 2.8,p <0.05。这种具有统计意义的影响是...(一些讨论随后就此统计意义进行了讨论,而没有提及甚至没有强大的能力来讨论该发现的大小的实际含义...在Neyman-Pearson框架下,tp值几乎毫无意义,您可以讨论的是效果是否存在。您永远无法真正谈论基于测试的效果实际上没有。)

要么

B)使用95%的置信区间,我估计效果在0.2到1.0之间。(随后进行了一些讨论,讨论了利息的实际影响,是否有意义的值是否具有任何特定含义以及是否使用了有意义的词来确切地表明其含义。此外,配置项的宽度可以直接用于讨论这是一个很好的发现还是只能得出更初步的结论)

如果您参加了基础统计学课,则可能最初会偏向A。在某些情况下,这是报告结果的更好方法。但是对于大多数工作来说,B远比它优越。范围估计不是测试。


@john的评论中有一个补充:首先,有时关键问题是CI是否跨越1,而不是0(例如,逻辑回归)。
彼得·弗洛姆-恢复莫妮卡

伙计们,是1还是0?(这对我来说很有启发性,所以我想,我需要学习正确的值来寻找!)@
John

95%CI与alfa = 0.05的双尾检验假设之间有什么关系?他们是一样的吗?
love-stats

爱情统计,如果使用相同,它们是相同的。
约翰

Adhesh Josh,原假设可以是任何预先指定的固定值。这是CI与直接NHST相比的另一个功能。这很容易,当你想反对0以外的假设值,用来测试
约翰

7

假设检验与置信区间之间存在等价关系。(请参见例如http://en.wikipedia.org/wiki/Confidence_interval#Statistical_hypothesis_testing)我将举一个非常具体的例子。假设我们从正态分布中得到样本x1,x2,,xn,均值为μ,方差为1,我们将其写为N(μ,1)。假设我们认为μ=m,我们要测试的零假设H0:μ=m,在水平0.05.因此,我们进行检验统计,在这种情况下,我们将其作为样本平均值:v=(x1+x2++xn)/n。现在,假设A(m)是该测试的v的“接受区域”。这意味着A(mv的可能值的集合,其零假设μ=被接受为0.05级(我将“已接受”用作“未拒绝”的简写-我不建议您认为原假设是正确的。)对于此示例,我们可以查看ñ1个正态分布,并选择在该分布下概率至少为0.95的任何集合。现在,对于95%的置信区域μ是该组的所有针对v是在一种。换句话说,它是所有的集合,对于该集合,观察假设的v将接受零假设。这就是为什么约翰说“如果某项效果的CI没有跨越0则可以拒绝原假设。”(John指的是检验μ=0。)

vμμ=0.05。μ=0.021个-0.98


请阅读此内容,因为p值不能解释为拒绝null的最小测试级别。“已经证明,在Neyman-Pearson假设检验上下文中,不允许在单个(或正在进行的)实验中解释p值。p值的计算仅取决于零假设的真相。p值无法测量支持HA的证据数量;它是针对H0的归纳证据的量度。” '来源:ftp.stat.duke.edu/WorkingPapers/03-26.pdf
sree22 '18

@ sree22您可以对此进行扩展,还是建议改写?我试图在这种情况下给出p值的定义,而不是解释。
DavidR

3

“学生”提出置信区间的理由是,他们可以表明哪些影响更重要,哪些影响更重要。

例如,如果您发现两个效果,则第一个效果对其财务影响的置信区间为5英镑至6英镑,而第二个效果的置信区间为200英镑至2800英镑。第一个在统计上更重要,但第二个可能更重要。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.