基思·温斯坦,
编辑:为澄清起见,此答案描述了残酷的统计游戏在国王基思·温斯坦答案中给出的示例。贝叶斯和惯常论答案都使用相同的信息,即在构造间隔时忽略有关公平和不公平硬币数量的信息。如果不忽略此信息,则在构建置信区间时,常客应使用综合的Beta-二项式似然法作为抽样分布,在这种情况下,Clopper-Pearson置信区间不合适,需要进行修改。贝叶斯解决方案中应进行类似的调整。
编辑:我也澄清了切碎机皮尔逊间隔的最初使用。
编辑:las,我的alpha是错误的方法,并且我的clopper pearson间隔不正确。我对@whuber表示最诚挚的歉意,他正确地指出了这一点,但是我最初不同意并忽略了他。
使用Clopper Pearson方法的CI非常好
θ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975]X=0
因此,使用Clopper Pearson置信区间的人永远不会被斩首。观察间隔后,基本上就是整个参数空间。但是CP间隔通过将100%的覆盖率设置为95%的间隔来实现!基本上,“常客”通过给95%的置信区间进行覆盖来“欺骗”他/她被要求提供的覆盖范围更大(尽管在这种情况下谁不会作弊?如果是我,我会全部[0, 1]间隔)。如果国王要求准确的 95%置信区间,那么无论实际发生什么,这种频繁使用的方法都将失败(也许存在更好的方法?)。
贝叶斯区间如何?(特别是最高后骨(HPD)贝叶斯间隔)
(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0(0.224,1)X=1
11012+1×110≈0
0.1
0.0250.975
要引用真实的 95%置信区间,则根据定义,应该观察到的区间的某些情况(即至少一种情况)不包含参数的真实值。否则,如何证明95%的标签是合理的?称其为90%,50%,20%甚至0%的间隔不仅是有效的还是无效的?
我不认为简单地陈述“实际上意味着95%或更多”而不附加限制是令人满意的。这是因为显而易见的数学解决方案是整个参数空间,而这个问题却微不足道。假设我要获得50%的CI?如果仅限制假阴性,则仅使用此条件,整个参数空间就是有效的CI。
100%X=0100×1012+9101012+1%>95%X=1
最后,要求不确定性的间隔,然后使用我们不确定的真实值来评估该间隔似乎有些奇怪。对我来说,在置信度和可信区间上进行“更公平”的比较,似乎是在区间上给出的不确定性陈述的真相。