置信区间的解释


16

注意:如果这是重复的事,请提前致歉,我在搜索中没有找到类似的q

假设我们有一个真实的参数p。置信区间C(X)是RV,包含95%的时间。现在假设我们观察X并计算C(X)。常见的答案似乎是将其解释为“有95%的机会包含p”是不正确的,因为它“要么包含p,要么不包含p”。

但是,比方说,我从一个洗过的纸牌的顶部挑选一张卡片,并将其面朝下。凭直觉,我认为这张卡成为黑桃王牌的概率为1/52,即使实际上“不是黑桃王牌”。为什么我不能将这种推理应用于置信区间示例?

或者,如果说卡的“概率”是黑桃的王牌是没有意义的,因为它是“是或不是”,那么我仍然会以51:1的概率说它不是黑桃的王牌。还有另一句话来描述此信息吗?这个概念与“概率”有何不同?

编辑:从贝叶斯概率的解释中,也许更清楚一点,如果我被告知随机变量包含p的95%的时间,那么给定该随机变量的实现(并且没有其他要限制的信息)是正确地说随机变量有95%的概率包含p?

编辑:同样,从概率论的概率解释来看,假设频率论者同意不说“置信区间包含p的概率为95%”之类的话。对于常客来说,拥有置信区间包含p的“置信度”是否仍然合乎逻辑?

令alpha为显着性水平,令t = 100-alpha。K(t)是置信区间包含p的常客的“置信度”。K(t)应该在t中增加是有道理的。当t = 100%时,常客应该确定(根据定义)置信区间包含p,因此我们可以归一化K(1)=1。类似地,K(0)=0。大概K(0.95)在0和1,并且K(0.999999)更大。频率论者会认为K与P(概率分布)不同吗?


1
的确,考虑一下硬币翻转,使硬币在桌子下面滚动,视而不见,我们考虑到硬币降落在头部的情况。乍一看,这似乎与配置项问题非常相似-显然是事件发生了还是没有发生。但是,在掷硬币的情况下,许多(也许甚至是大多数)常客似乎很乐意为最终出现在头上的未观察到的硬币分配名义概率(例如),而回避对包含随机数的随机区间说同样的话。参数。在我看来似乎存在矛盾之处。p
Glen_b-恢复莫妮卡2015年

@Glen_b在未观察到的掉落硬币情况下,常有的人运用反事实推理说,不是硬币的实际面值是“随机的”(尽管它是未观察到的),但我们可以观察到的结果概括为这次掉落的其他潜在结果硬币和计算概率。至于硬币实际面值的概率,无论是正面还是非正面,都没有概率。该保存该设置的反施工。p
AdamO 2015年

@Glen_b:我同意,在这里看到我的问题:stats.stackexchange.com/questions/233588/...
vonjd

@vonjd您的问题在多大程度上不只是开头“注:”之后第一段的重复?
Glen_b-恢复莫妮卡

@Glen_b:说实话,当我发布我的消息时我并不知道这个问题,它们肯定重叠。但是我认为它们不是重复的,因为我更普遍地关注将概率用于隐藏结果(这会对置信区间产生影响),而这纯粹是针对置信区间。但是,如果您认为我的是重复的,请随时关闭它。
2016年

Answers:


8

我认为对此事的许多常规说法尚不清楚。

比方说,你拿大小的样品,并获得95 的置信区间p10095%p

然后,您获得了另一个独立于第一个的样本,并获得了p的另一个95 置信区间。10095%p

改变的是置信区间;不变的是p 这意味着在惯常方法中,有人说置信区间是“随机的”,但是p是“固定的”或“恒定的”,即不是随机的。在置信区间方法等频繁主义者方法中,仅将概率分配给随机事物。

因此并且L U 是置信区间。(L = “下部”,U = “上部”。)取一个新样本,LU改变,但p不变。Pr(L<p<U)=0.95(L,U)L=U=LUp

假设在特定情况下,您有U = 43.61。在惯常方法中,不会将概率分配给语句40.53 < p < 43.61,而不是概率01,因为这里没有什么是随机的:40.53不是随机的,p不是随机的(因为如果我们采用一个新样本),并且43.61不是随机的。L=40.53U=43.6140.53<p<43.610140.53p43.61

在实践中,人们的行为确实像是确信p40.5343.61之间。实际上,这通常很有意义。但有时并非如此。一种这样的情况是,如果事先不知道多达40个或更大的数字是不可能的,或者如果已知它们非常可能的话。如果可以为p分配一些先验概率分布,则可以使用贝叶斯定理来获得一个可信区间,该区间可能与置信区间不同,这是因为事先知道了p的取值范围95%p40.5343.6140pp是可能的还是不可能的。实际上,数据本身(也可能是事实)(如果采用新样本会发生变化)会告诉您不太可能甚至最大等于40。即使在对L U p足够统计的情况下,也可能发生这种情况。在某些情况下,可以通过Fisher的辅助统计条件方法来解决该现象。最后一个现象的一个例子是,当样本仅由两个独立的观察组成时,它们以θ ± 1 / 2的间隔均匀分布p40(L,U)pθ±1/2。那么,从两个观测值中较小的一个到较大的间隔是置信区间。但是,如果它们之间的距离是0.001,那么在它们之间确保θ的50 %左右是不合理的;如果距离是0.999,那么可以合理地几乎确保它们之间的θ100 。它们之间的距离将是条件的辅助统计量。50%0.00150%θ0.999100%θ


谢谢迈克尔,这很有道理。让我们假设在您的示例中,我们有一个特定的(L,U),但是我们不知道这些值。我们所知道的是,这是95%置信区间随机变量的实现。在没有任何先验参数或其他任何信息的情况下,是否合理地以19:1的赔率确定(L,U)包含该参数?如果一个常客愿意这样做,却不称其“愿意以19:1的赔率将其包含参数”称为“概率”,那我们将如何称呼它呢?
applicative_x

是的,该概率为。当然,在频频方法中,可以说,在L U 无知的状态下,该间隔包含p的概率为0.95。但是,当一个值具有特定的值(不是随机值)时,由于LU的已知值不是随机值,因此常客不会为该语句分配除01之外的其他概率。0.95(L,U)0.95p01LU
Michael Hardy 2015年

4

一个的教科书定义%置信区间是:100×(1α)

在理想条件下进行多次独立复制研究后,该时间间隔可捕获%时间的重复效应测量值 。100×(1α)

对于常客来说,概率来自“复制时间和空间”的概念来复制发现,就好像创造了无数个世界副本来一次又一次地评估科学发现一样。因此,概率就是频率。对于科学家来说,这是讨论发现的非常方便的方法,因为科学的第一原则是研究必须是可复制的。

在您的卡片示例中,贝叶斯和常客的困惑在于,常客不会为您从卡组翻转过来的特定卡的面值分配概率,而贝叶斯会。该常客将概率从随机洗牌的甲板顶部翻转到一张牌上。贝叶斯不关心复制研究,一旦翻转卡片,您现在100%相信卡片是什么,而0%相信卡片可能具有任何其他价值。对于贝叶斯主义者,概率是对信念的度量。

请注意,由于这个原因,贝叶斯人没有置信区间,他们用可信度区间总结了不确定性。


感谢您的回复。在纸牌示例中,贝叶斯人和常客不是都同意51:1是该纸牌是黑桃王牌的公平几率吗?类似地,为了实现95%的置信区间(并且没有其他信息),难道不是两者均以19:1的概率包含真实参数吗?从这种意义上说,贝叶斯能否将95%的置信区间解释为具有95%的机会包含真实参数?
applicative_x

@applicative_x枕形甲板怎么样?您正在考虑使用先验信息。该频率论者只能假设的概率为,只使用该卡的脸valueto告知本实验中是否是一致的或不符合这一假设。任何类型的区间估计(可信度或置信度)的有效性取决于无法验证的假设。有没有这样的事,作为一个真正的参数,这是思考科学的以危险方法。根据先前的定义,贝叶斯算法没有置信区间。重新阅读答案。p=1/52
AdamO 2015年

谢谢亚当,我想我还是很困惑。假设我(通过查看纸牌)知道52张纸牌是标准的。我洗了副牌,挑出前十张纸牌而不看它们。在这种情况下,我不能将“ true参数”定义为红牌数量吗?然后,不管贝叶斯vs频繁主义者,都有一个“真实参数”。如果允许我来接7张牌随机我也能想象构建一个置信区间的循环移位#of红牌了我10
applicative_x

1
贝叶斯不必相信没有参数的真实值。贝叶斯主义只是意味着将概率分配给不确定的语句,而不管它们是否是随机的。贝叶斯可以分配概率至有一个十亿年前火星上有生命的说法。一位常客不能做到这一点,因为不能说那是所有情况的一半。没有什么可以说贝叶斯主义者不能相信对火星上是否有这样的生命这个问题有一个真正的答案。另请参阅我对您问题的已发布答案。1/2
Michael Hardy 2015年

1
@AdamO:我发现您的评论很神秘。“真理的概念是什么效用的”是对主题的改变。“我们认为真理是一成不变的。” 那么“我们”是指您和其他人,他们的想法有什么意义?“没有科学家会为了验证已知的东西而去收集数据。” 这似乎是主题的另一变化。然后跟随一些关于常客和贝叶斯主义者的评论。我不想猜测你想说什么。
Michael Hardy
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.