非数学家的Clopper-Pearson


12

我想知道是否有人可以向我解释Clopper-Pearson CI之外的直觉。

据我所知,每个配置项都包含一个差异。但是,对于比例,即使我的比例是0或1(0%或100%),也可以计算Clopper-Pearson CI。我尝试查看这些公式,但我知道它具有二项式分布的百分位数,而且我知道查找CI涉及迭代,但是我想知道是否有人可以用“简单的单词”或最少的数学来解释逻辑和有理数?

Answers:


22

当您说习惯于包含方差表达式的置信区间时,您想到的是高斯情况,在该情况下,样本概括了表征总体的两个参数(一个平均值和另一个方差)的信息。均值和样本方差。样本均值估计总体均值,但其准确性取决于总体方差,而总体方差又由样本方差估算。另一方面,二项式分布只有一个参数-每个单独试验的成功概率-&样本中给出的有关此参数的所有信息汇总在总编号中。如此多的独立试验获得成功。总体方差和均值均由此参数确定。

您可以直接使用二项式概率质量函数为参数获得Clopper–Pearson(例如)的95%置信区间。假设您在试验中观察到成功。pmf是×πxn

Pr(X=x)=(nx)πx(1π)nx

增加直到或更少的成功概率降至2.5%:这是您的上限。降低直到或更多成功的概率下降到2.5%:这是您的下界。(我建议您从阅读起来不清楚的情况下,实际上尝试这样做。)您在这里所做的是找到的值,当将其作为空假设时,它会(仅)被a拒绝。两尾检验的显着性水平为5%。从长远来看,以这种方式计算的边界至少在95%的时间内覆盖了的真实值。πxπxππ


+1。这可能值得一个问题,但在这里我会快速提出:对于一个特定的应用程序,我希望获得一个针对各个比例的单一不确定性度量(其表现类似于平均值的标准误差)。我知道有很多二项式CI程序,包括Clopper-Pearson。将CI的宽度作为不确定性度量是否有意义?或者,宽度为1.96 / 2,以使其在高斯范围内精确产生SEM。
变形虫说恢复莫妮卡

1
@amoeba:大概是在考虑小样本量:(1)您可能想要像Blaker-Spjotvoll CI那样的东西,而不是基于均等面积测试的CI。(2)置信度分布比较不稳定,这会使任何给定间隔的宽度对您指定的覆盖范围不愉快。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.