二项式估计为0或1的置信区间


36

如果您估计(或类似地)并且样本量相对较小(例如),那么计算二项式实验的置信区间的最佳技术是什么?p=0p=1n=25


有多接近零?它是否经常为零,或大约为0.001、0.01或...?您有多少数据?p^
jbowman

我们通常有800多个试验。我们通常期望为0到0.1p^
AI2.0

使用链接的Clopper–Pearson间隔。一般原则:首先尝试使用Clopper–Pearson间隔。如果计算机无法获得答案,请尝试近似法,例如常规近似法。根据当前的计算机速度,我认为在大多数情况下我们不需要近似。
user158565 '18

为了仅使用(1-置信水平)获得置信区间的上限,我们将仅使用B(1- ; x + 1,n−x),其中x是成功(或失败)的次数, n为样本大小在Python中,我们只使用。如果这是真的,我们可以得出结论,我们是1-。 \相信,上限是由我们从计算值限定?ααscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) αscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
AI2.0

1
在进行800次试验后,通常的法线近似值将在大约范围内正常工作(我的模拟显示95%置信区间的94.5%实际覆盖率。)在1000次试验和,实际覆盖率约为92.7%。 (全部基于100,000个重复。)因此,考虑到您的试用次数,这仅是对于非常低的的问题。p = 0.01 pp=0.015p=0.01p
jbowman

Answers:


53

不要使用正态近似

有关此问题的文章很多。一般建议不要使用正态逼近(即渐近/瓦尔德置信区间),因为它具有可怕的覆盖范围。R代码说明了这一点:

library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

二项式比例的渐近置信区间的覆盖概率。

对于较小的成功机率,您可能会要求95%的置信区间,但实际上却获得10%的置信区间!

推荐建议

那么我们应该使用什么呢?我认为当前的建议是Brown,Cai和DasGupta在《统计科学 2001》第一卷中的“二项式比例区间估计”中列出的建议。16号 2,第101-133页。作者研究了几种计算置信区间的方法,并得出以下结论。

对于较小的n,建议使用Wilson区间或等尾Jeffreys先验区间;对于较大的n,建议在Agresti和Coull中建议的区间。

威尔逊(Wilson)间隔有时也称为得分间隔,因为它基于反转得分测试。

计算间隔

要计算这些置信区间,您可以使用此在线计算器或R binom.confint()binom软件包中的函数。例如,如果25次试验中成功0次,则R代码为:

> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
  type="central")
         method x  n  mean  lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2         bayes 0 25 0.019  0.000 0.073
3        wilson 0 25 0.000  0.000 0.133

bayes是杰弗里斯间隔。(type="central"需要该参数以获取等尾间隔。)

请注意,计算间隔之前,应确定要使用三种方法中的哪一种。同时查看这三个选项并选择最短的选项,自然会给您带来很小的覆盖概率。

快速,近似的答案

最后要注意的是,如果您在n次试验中观察到恰好为零的成功,并且只想非常快速地近似置信区间,则可以使用3的规则。只需将数字3除以n即可。在上面的示例中,n为25,因此上限为3/25 = 0.12(下限当然为0)。


非常感谢您的回答。想象一下这个现实示例:建筑师必须在摩天大楼中测试天花板上的所有隔热板是否正确安装。他在随机选择的地板上打开了25个天花板面板,并且首先找到了这些天花板面板的隔热材料。因此,我们可以根据Wilson得分区间得出结论,在CI [0.867到1]之间有95%的确定性具有隔热板的真实概率是多少?
卡巴斯尔2014年

2
我不会说您可以用“ 95%的确定性”(Google用“正确解释置信区间”)得出结论。同样,这是基于对独立试验具有相同成功概率的假设,在这里可能不现实。可能最后安装的面板安装不正确的风险较高(安装人员会感到厌倦/无聊)。也许第一个是,因为那时的人经验不足。无论如何,如果告诉建筑师测试所有面板是否正确安装,他应该做自己的工作,而不仅仅是测试样品!
2014年

5
bayes当两个形状参数均为1时,使用统一优先级(而不是Jeffrey)。出于对Jeffrey统一优先级的(劣势)的好奇心,我通过电子邮件向Binom软件包的维护者发送电子邮件,他告诉我将使用新版本统一优先级为默认值。因此,请不要怀疑结果将来是否会略有不同。
cbeleites支持Monica

3
这是一个很好的答案。它传达了您可以在该主题的论文中阅读的所有关键信息,但非常简洁明了。如果我能投票两次,我会。
SigmaX

6
中的binconf方法Hmisc还计算这些间隔。它默认为Wilson方法。
SigmaX

0

Agretsi(2007,pp.9-10)显示,当比例下降到接近0或1时,置信区间效果较差。取而代之的是,使用“对偶信度重要性检验... [由的所有值组成的,可以判断为合理的空假设参数”,其中是未知参数。通过求解为此在方程 。通过对两边进行平方 使用二次公式求解,这将得出适当的临界z值。p±zα/2p(1p)/nπ0π0π0

|pπ0|p(1p)/n=0
(1+z02/n)π02+(2pz02/n)π0+p2=0


1
谢谢你的笔记。只想澄清: 是中假定的失败(或成功率),而p是从样本中观察到的失败(或成功率)。n是样本大小,因此我们试图求解近似z值?(这里的基本假设是什么?)(您介意将我链接到论文Agretsi(2007,9-10页))。π0
AI2.0

是的,是总体参数,是基于样本的参数估计,是样本量。此过程将为您提供所需的关键z值。基本假设在末尾的Agretsi和Coull(1998)中得到充实。不幸的是,Agretsi(2007)是一本教科书,所以我无法链接到它。 Scholar.google.com/…– p Ñπ0pn
Jay Schyler Raadt

那是阿格雷斯蒂。
尼克·考克斯

@NickCox这是另一幅作品
Jay Schyler Raadt '18

1
艾伦·阿格里斯蒂(Alan Agresti)发表了各种文字。我猜您正在暗示约翰·威利(John Wiley)的《分类数据分析简介》(2007年第2版;计划于2018年10月出版的第3版,可能带有2019年的日期)。
尼克·考克斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.