围绕非显着效应的狭窄置信区间能否为无效提供证据?


9

假设拒绝拒绝null表示null为真显然是错误的。但是,在一个情况下空未被拒绝和相应的置信区间(CI)是窄和围绕着0,这是否没有提供证据空?

我有两种想法:是的,实际上,这将提供证据表明效应几乎为0。但是,在严格的假设检验框架中,似乎无效效应及其对应的CI根本无法推理。那么,当CI的点估计不重要时,它的含义是什么?它是否也不能用于推理,还是可以像前面的示例中那样用于量化无效的证据?

鼓励提供具有学术参考意义的答案。


您可能会对等效性测试以及对该产品进行详细说明的网站感兴趣。请参阅如何检验无组差异的假设?举一个例子。
安迪W

1
如果您的意思是针对某点的证据无效而没有其他选择 ...那么,否。在观察到的非常小的值和空值之间存在无数的替代选择的可能性仍然比空值更大。如果您有其他意思,那么也许在某些情况下。
Glen_b-恢复莫妮卡2014年

是的,那将是同等测试的问题,这个术语我还没有听说过。
ATJ 2014年

Answers:


6

简而言之:是的。

正如安迪·W(Andy W)所写,得出结论,该参数等于指定值(在您的情况下,效果大小等于零),这是等效测试的问题。

在您的情况下,此狭窄的置信区间实际上可能表明效果实际上为零,这意味着等价物的零假设可能会被拒绝。的等效值1α-level通常由普通显示 12α-置信区间完全位于预定的等效区间内。该等效间隔考虑到了您能够忽略非常小的偏差,即,在该等效间隔内的所有效果大小都可以视为实际上等效。(无法进行统计上的均等检验。)

请阅读Stefan Wellek的“测试等效性和非劣等性的统计假设”以进一步阅读,这是关于此问题的最全面的书。


2

空假设说明了“所有模型都是错误的,但有些模型是有用的含义如果不按字面意义在上下文之外使用它们,它们可能是最有用的-也就是说,记住null的认知目的很重要。如果它可以被伪造,这是预期的目标,那么通过比较,替代方案将变得更加有用,尽管它仍然毫无意义。如果您拒绝空值,则是说效果可能不为零(或其他任何原因–空值假设也可以指定其他值来进行伪造)...那么那是什么?

您计算的效果大小是总体参数的最佳点估计。通常,被高估或被低估的机会都应该是一样的好,但是就像@Glen_b的评论所暗示的那样,它成为死心的靶心的机会是无穷的。如果命运的某种怪异转折(或通过构造-无论是哪种方式,我假设我们是在假设地说?),您的估计就直接落在了0.0¯,这仍然没有太多证据表明该参数在置信区间内没有不同的值。置信区间的含义不会根据任何假设检验的重要性而改变,除非它可能以相关方式改变位置和宽度。

如果您不熟悉无效假设在字面上是真实的(模拟)总体中样本的估计大小估计是什么样的情况(或者如果您还没有看到它,并且只是在这里稍作统计, ),检查出杰夫·卡明的的舞蹈p价值观。如果这些置信区间不足以适合您的口味,我尝试使用随机生成的样本(略低于)模拟R中的一些置信区间n=1M 每个来自 N(0,1)。我忘记设置种子,但在完成此答案之前,设置x=c()并运行x=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))了我所关心的次数,最终给了我6000个样本。这是分别使用hist(x,n=length(x)/100)和的直方图和密度图plot(density(x))

    

正如人们所期望的,有证据表明,这些总体随机样本实际上具有零影响,从而产生了各种非零影响,并且这些估计值或多或少以正态分布在真实参数周围(skew(x)= -.005,kurtosis(x)= 2.85)。想象一下,您仅从一个样本中知道估算的价值n=1M,而不是真正的参数:为什么您希望参数比估计值更接近零而不是更接近?您的置信区间可能包括空值,但与从相反方向到您的样本效果大小的等效距离的值相比,该空值实际上似乎没有任何更多的合理性,而其他值可能更合理,尤其是您的点估计!

在实践中,如果您想证明某个效果或多或少为零,则需要定义您倾向于忽略或多或少的程度。我模拟了这些巨大的样本,得出的最大震级估计为|r|=.004。具有更真实的示例n=999,我发现其中最大的 1M 样品是 |r|=.14。同样,残差是正态分布的,因此它们不太可能出现,但要点是它们并非难以置信。

一般而言,CI可能比NHST更有用。它不仅仅表示假设参数很小可以忽略不计的想法。它表示该参数实际是什么的一个好主意。仍然可以决定这是否可以忽略不计,但也可以了解它可能是不可忽略的。有关置信区间的进一步倡导,请参见卡明(2014,2013

参考文献
-Cumming,G.(2013年)。了解新的统计数据:效应大小,置信区间和荟萃分析。Routledge。
-卡明(G.)(2014)。新的统计数据:原因和方式。心理科学,25(7),7–29。从http://pss.sagepub.com/content/25/1/7.full.pdf+html检索。


谢谢,我对卡明的工作非常熟悉。我想我的问题更多的是,“如果ES估计点不重要,那么可以将CI用于推理吗?(或者它们是'null',即没有用做点估计)”
ATJ

1
@ATJ:的点估计和(1个-α)当置信区间与零(在级别上)没有显着差异时,其置信区间变为“无用” α)或分别包含零。
Scortchi-恢复莫妮卡

@ATJ:正如我所说,CI的含义[/ utility]不会根据任何NHST的重要性而改变。一般而言,CI可能比NHST更能进行推理……它很好地说明了参数的实际含义。例如,我刚跑步cor.test(rnorm(9999999),rnorm(9999999))并获得了CI{-0.000630.00060}。因此,我推断,当我再次运行它时,我有95%的可能性会得到该范围内的新估计。再次运行,我的估计是[R=0.00029; 我基于CI的推论是正确的!空值碰巧是由构造造成的,但我的证据会代替我的估计……
Nick Stauner 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.