是否在95%置信区间内的所有值均具有相同的可能性?


56

我在以下问题上发现了不一致的信息:“ 如果构建了均值差异或比例差异的95%置信区间(CI),则CI中的所有值是否均等可能?或者,该点估计是否最有可能,与CI的“尾部”相近的值是否比CI的中间值小?

例如,如果一项随机临床试验报告指出,采用特定治疗的相对死亡风险为1.06(95%CI为0.96至1.18),则0.96的正确值是否等于1.06?

我在网上找到了很多关于此概念的参考,但是以下两个示例反映了其中的不确定性:

  1. 丽莎·沙利文(Lisa Sullivan)关于置信区间模块指出:

    均值差异的置信区间提供了()可能值的范围。重要的是要注意,置信区间中的所有值都是(μ_1-μ_2)真实值的估计值。μ1μ2μ1μ2

  2. 这篇标题为“ 误差范围之内”的博客文章指出:

    我想到的是对“误差范围”的误解,该误差范围将置信区间内的所有点均等地对待,好像中心极限定理暗示了有界均匀分布而不是t分布。[...]
    谈论“误差范围”遗漏的是,接近点估计的可能性要比位于边缘的可能性大得多。”

这些似乎是矛盾的,那么哪个是正确的?


7
我不知道是否有混乱的地方与p值均匀地在零假设下分发的相关概念..
迈克尔·麦高恩

4
第一个报价是本来准确的置信区间的异常滑移。第二个引号来自一个很好的说法,它是一个草率的混乱:充满了模糊,不正确或只能以贝叶斯意义解释的陈述。但是两种报价都是错误的
ub

@whuber我不会把第二个叫做烂摊子……我会把它称为贝叶斯对惯常主义的解释:)
Michael McGowan 2012年

1
@Michael的一个草率示例是一种独裁主义,例如断言CLT意味着“ [人口]均值的无数重复估计仍将遵循正态分布”。为了将思想简单地传达给非技术性的听众,就不必
ub

2
@whuber,我认为您引用的那句话只是轻微的罪过。主要错误是CLT不涉及t分布。

Answers:


23

需要回答的一个问题是,在这种情况下“可能”是什么意思?

如果它表示概率(有时被用作其同义词),并且我们使用严格的频繁定义,则真实参数值是一个不变的单一值,因此该点的概率(似然性)为100%其他值为0%。因此几乎所有的可能性都为0%,但是如果间隔包含真实值,则该间隔与其他间隔不同。

如果我们使用贝叶斯方法,则CI(可信区间)来自后验分布,您可以比较区间内不同点的可能性。除非后验在区间内完全均匀(理论上可能,但那是一个奇怪的情况),否则值具有不同的可能性。

如果我们使用可能与置信度相似的方法,请这样考虑:计算一个95%的置信区间,一个90%的置信区间和一个85%的置信区间。我们将有5%的信心相信真实值位于95%区间内但在90%区间之外的区域,我们可以说真实值可能会下降5%。在90%区间内但在85%区间外的区域也是如此。因此,如果每个值的可能性均等,则上述2个区域的大小必须完全相同,并且对于置信区间为10%但置信区间为5%外的区域,其大小也必须相同。使用间隔构造的标准分布均不具有此属性(特殊情况除外,即从制服中抽出1次)。

您可以通过模拟来自已知总体的大量数据集,计算感兴趣的置信区间,然后比较真实参数比每个端点更接近点估计的频率,来进一步证明这一点。


3
这个问题在答案中所需要的是可能性,而不是概率论者或贝叶斯主义者。可能性提供了确切的答案,其他人则只能通过一些扭曲和伸展才能做到。
Michael Lew 2012年

1
@Greg我喜欢你的解释。明确地说,您的论点支持以下观点:95%CI的“尾部”值比接近点估计的值更不可能(不太可能),对吗?感谢您的答复。
pmgjones 2012年

1
@pmgjones可能性较小,否,请参见第二段。在第4款中,可能性较小,是。
格雷格·斯诺

2
@GregSnow您的第二段几乎完全说出true参数为true参数的概率为100%。您是否真的相信这种重言式是“严格的常客定义”所提供的?
rolando2 2013年

2
@ rolando2,我认为常客统计数据可以提供很多信息,我只是在消除一些常见的错误陈述,这些错误陈述暗示真正的价值变化,并且有时超出时间范围,有时超出时间范围(有时更接近界限,有时更接近界限)。中央)。随后的段落将使您对这些想法有更真实的感受。
格雷格·斯诺

19

这是一个很好的问题!有一个称为“可能性”的数学概念,可以帮助您理解问题。Fisher发明了可能性,但认为它比概率要差一些,但事实证明,可能性比概率更“原始”,Ian Hacking(1965)认为它是公理的,因为它是不可证明的。可能性是概率的基础,而不是相反的基础。

Hacking,1965年。统计推断逻辑

没有充分的理由就没有在标准的统计教科书中给予可能性以应有的重视。它与概率的不同之处在于几乎完全具有人们期望的特性,并且似然函数和区间对于推断非常有用。某些统计学家可能不喜欢似然性,因为有时没有“适当”的方法来推导相关似然函数。但是,在许多情况下,似然函数是显而易见的且定义明确。对推理可能性的研究应该从Richard Royall的一本小巧易懂的书开始,即《统计证据:似然范例》

您的问题的答案是,不,任何时间间隔内的点都不会具有相同的可能性。在置信区间边缘的那些概率通常比在置信区间中心的概率低。当然,传统的置信区间不会直接告诉您与特定实验相关的参数。Neyman的置信区间是“全局”的,因为它们被设计为具有长期属性,而不是与手头实验相关的“局部”属性。(可以在本地解释出良好的长期性能,但这是一种理智的捷径,而不是数学上的现实。)可能性区间(在可以构建的情况下)直接反映了与手头实验相关的可能性。


1
@suncoolsu所讨论的间隔不必为该语句为true的似然间隔。间隔仅需跨越最可能的估计值,以使间隔边界的可能性均小于间隔内的某个点。任何普通的置信区间都将满足该要求。
迈克尔·卢

2
@pmjones 95%CI不会告诉您CI边缘的值是否比中间值更接近真相。配置项声明有关从人口中重复抽样的声明。从长远来看(即在重复采样之后),为每个样本构建的95%的CI将覆盖真实值。因此,有两个主要观察结果:1)一个给定CI的真实值不能说什么2)CI不能告诉您有关所观察到的数据的任何信息,这是通常的贝叶斯批评。
suncoolsu 2012年

1
@MichaelLew似然法很有用,但我说的是(引用LW)“的确,所有常客推理都违反了LP,因此,如果我们遵守LP,我们将不得不放弃常客推理。” 因为CI是一个经常性的想法,所以它违反了LP(您说这是基本的)。
suncoolsu 2012年

1
@suncollsu的问题不是,单独的置信区间是否没有任何其他统计上的考虑,是否可以说明其内部参数值的可能性。它与间隔内参数值的可能性有关。似然函数可以回答问题,即使置信区间违反似然原理,该答案也是正确的。(再次阅读我以前的评论。您似乎完全忽略了它的内容。)
Michael Lew 2012年

2
设计了@ rolando2 Neyman的95%置信区间,以便在95%的情况下使用该方法时该方法都包含真实参数。严格来说,置信度是方法的结果,而不是任何单独的时间间隔,因此,单独的时间间隔不会告诉您有关该特定实验中世界状况的任何信息。请参阅我对这个问题的回答以获取更多详细信息:stats.stackexchange.com/questions/8844/…–
Michael Lew,

18

假设有人告诉我,我应该信任 CI95中的所有值,作为人口价值的潜在指标。(我故意避免使用“可能”和“可能”一词。)95的特殊之处是什么?没什么:要保持一致,我还必须对CI96,CI97,...和CI99.9999999中的所有值给予同等的信任。当配置项的覆盖范围接近其极限时,实际上必须包括所有实数。这个结论的荒谬使我拒绝了最初的主张。


4
这是一个很好的答案!我应该考虑过接近可能的CI的影响。感谢您撰写本文!
pmgjones 2013年

2

让我们从置信区间的定义开始。如果我说一个95%的置信区间从此变为那个,则表示具有这种性质的陈述大约在95%的时间内为真,而在大约5%的时间内为假。我并不一定意味着我对这一声明有95%的信心。90%的置信区间会更窄,而80%的区间还会更窄。因此,当想知道真正的价值是什么时,我对价值的信任就降低了,因为它们越来越接近任何特定置信区间的边缘。

注意,以上所有都是定性的,尤其是“信誉”。(我在该声明中避免使用“信心”或“可能性”一词,因为它们携带的数学行李可能与我们的直觉行李有所不同。)贝叶斯方法会将您的问题改写为具有定量答案的问题,但我不想打开这里可能有蠕虫。

Box,Hunter和Hunter的经典著作(“统计人员”,Wiley,1978年)也可能会有所帮助。请参见第113页ff页的“置信区间集”。


由于我们在某种程度上处理概念而部分在处理语义,因此我要指出,在您的第二句话中,您说的是“ ...具有这种性质的陈述将是真的...”,而未指定将使用哪种陈述是正确的。
rolando2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.