正确地说,95%的置信区间是使用在95%的情况下有效的方法得出的结果,而不是任何具有95%可能性包含期望值的单独区间。
“即使到现在,置信限度的逻辑基础和解释仍是一个有争议的问题。” {David Colquhoun,1971年,生物统计学讲座}
该报价摘自1971年出版的统计教科书,但我认为在2010年仍然如此。对于二项式比例的置信区间,这种争论可能是最极端的。计算这些置信区间的方法很多,但从一种或多种意义上讲都是不准确的,即使是表现最差的方法也受到教科书作者的支持。即使是所谓的“精确”间隔也无法产生预期的置信区间属性。
John Ludbrook和我在为外科医生写的论文中(众所周知,他们对统计学很感兴趣!),我主张使用统一贝叶斯先验方法计算的置信区间的常规使用,因为这种区间的频次性好于任何其他方法(平均而言)覆盖所有真实比例的准确度是95%),但重要的是,覆盖所有观察比例的覆盖度要好得多(准确度是95%)。由于该文档的目标受众非常详尽,因此可能无法说服所有统计学家,但我正在研究具有完整结果和论据的后续论文。
在这种情况下,贝叶斯方法的频度特性与频度方法一样好,这种情况经常发生。先验统一的假设没有问题,因为我遇到的每次常客覆盖率计算都建立了人口比例的统一分布。
您问:“至少在某些情况下,有没有办法查看置信区间,这对统计用户有意义?” 那么,我的答案是,对于二项式置信区间,对于所有观察到的比例,可以得到准确地包含人口比例的时间间隔为95%的间隔。是的。但是,常规使用置信区间期望覆盖所有人口比例,并且答案是“否!”
您对问题的回答的长度以及对它们的各种回答表明,置信区间被广泛误解了。如果我们将目标从所有真实参数值的覆盖范围更改为所有样本值真实参数值的覆盖范围,则可能会变得更加容易,因为间隔将被成形为与观测值直接相关,而不是与观测值的性能相关。方法本身。