置信区间何时有用?


30

如果我正确理解,则参数的置信区间是通过一种方法构造的区间,该方法可得出包含指定比例样本的真实值的区间。因此,“置信度”是关于方法的,而不是我从特定样本计算的间隔。

作为统计的用户,由于所有样本的空间都是假设的,因此我一直对此感到受骗。我只有一个样本,我想知道该样本告诉我有关参数的信息。

这个判断错了吗?至少在某些情况下,是否存在查看置信区间的方法,这对统计用户有意义?

[这个问题源于第二个想法在math.se答案瞧不起置信区间后https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 #7572 ]

Answers:


15

我喜欢将CI视为逃避假设测试(HT)框架(至少是遵循Neyman方法的二元决策框架)并以某种方式与度量理论保持一致的一种方式。更准确地说,我认为它们更接近估计的可靠性(例如,均数差异),相反,HT更接近假设推论推理,但有其缺陷(我们不能接受零值,替代方案是经常是随机的等)。尽管如此,在使用间隔估计和HT时,我们大多数时间都必须依赖分布假设(例如下的采样分布),这可以从我们的样本中推断出总体样本或代表性样本(至少在样本样本中)。常客方法)。H0

H0

替代文字

也就是说,在HT框架(左)下,您将查看统计数据与零值之间的距离,而在配置项(右)下,您将在某种意义上查看“来自统计数据”的零值影响。

另外,请注意,对于某些类型的统计数据(例如,赔率比),HT通常是无意义的,因此最好查看不对称的关联CI,并提供有关关联的方向和精度(如果有)的更多相关信息。


为什么您说假设检验对比值比通常没有任何意义,比任何其他影响估计值更重要?我要强调的是,对于有限样本中的比值比和其他具有非对称采样分布的估计,置信区间比标准误差更有用。
一站式

@onestop好吧,我在某种程度上考虑了您对“不对称抽样分布...”的看法(似乎我不太清楚),但也想到了这样一个事实,即在流行病学研究中,我们通常对CI最为感兴趣(就是说,我们的估算比HT精确。
chl 2010年

+1。这使我想起,我一直在使用您的脚本来学习渐近线,方法是跳入并改变周围的东西,尝试不同的东西。再次感谢您,对入门非常有帮助。
ARS

@ars实际上,我似乎还记得这张照片是用PStricks制作的。无论如何,渐进线的一个很好的起点是piprime.fr/asymptote
chl 2010年

@chl,这可能是题外话,但是能否请您告诉我您是否在R中制作了这些图表?
suncoolsu

7

与您的第二个问题有关的另一种方法是:“是否存在至少在某些情况下对置信区间有意义的统计方式的方法?”:

您应该查看贝叶斯推断以及由此产生的可信区间。95%可信区间可以解释为您认为包含真实参数值的概率为95%的区间。您要付出的代价是,您需要在相信真实参数可能会采用的值之前,先收集概率分布,然后再收集数据。而且您的先验可能与其他人的先验不同,因此即使您使用相同的数据,您得到的可信区间也可能会有所不同。

这只是我快速而粗略的总结!一本近期实用的优秀教科书是:

Andrew Gelman,John B.Carlin,Hal S.Stern和Donald B.Rubin。“贝叶斯数据分析”(第二版)。Chapman&Hall / CRC,2003年。ISBN978-1584883883


谢谢。但是,特别是频繁主义者的置信区间呢?在任何情况下都没有意义吗?
Jyotirmoy Bhattacharya 2010年

我相信有不同的先验是没有问题的(至少从客观贝叶斯角度来看),如果碰巧您对当前情况有不同的了解。我们必须将先验视为铸造先验信息的一种方式。我知道这并不简单...
teucer 2010年

@Jyotirmoy关于贝叶斯与频率论方法,有趣的论点在这里提出:stats.stackexchange.com/questions/1611/...
CHL

6

我认为这个问题的前提是有缺陷的,因为它否认了不确定已知之间的区别。

描述硬币翻转提供了一个很好的类比。在掷硬币之前,结果是不确定的。之后,它不再是“假设的”。将这种既成事实与我们希望了解的实际情况(硬币的行为,或由于其结果而做出的决定)相混淆,本质上否认了理解世界的可能性。

在实验或管理领域内,这种反差大大减轻了。在这种情况下,科学家或监管者知道他们将面对任何情况,其结果在任何时候都不会事先知道,但是他们必须做出重要的决定,例如如何设计实验或建立用于确定是否遵守规定的标准(用于药物测试,工作场所安全,环境标准等)。这些人和他们工作的机构需要方法这些方法概率特征知识,以便开发出最佳且可辩护的策略,例如尽可能少犯错误的良好实验设计和公平决策程序。

置信区间尽管在传统上是不合理的,但仍适用于此决策理论框架。当构造随机间隔的方法具有良好的属性组合时,例如确保最小的预期间隔覆盖范围并最小化间隔的预期长度(这两者都是先验属性,而不是属性),则在使用该方法的漫长职业中,我们可以最大程度地减少与该方法指示的操作相关的成本。


举一个使用置信区间进行决策的示例。或者,更好的是,比较两个置信区间以及您如何对每个置信区间做出不同的决定,同时完全遵守常人主义框架。
BrainPermafrost

@Brain任何介绍性统计资料的教科书都将提供此类示例。毫不掩饰的常客是Freedman,Pisani和Purves,Statistics(任何版本)。
ub

6

正确地说,95%的置信区间是使用在95%的情况下有效的方法得出的结果,而不是任何具有95%可能性包含期望值的单独区间。

“即使到现在,置信限度的逻辑基础和解释仍是一个有争议的问题。” {David Colquhoun,1971年,生物统计学讲座}

该报价摘自1971年出版的统计教科书,但我认为在2010年仍然如此。对于二项式比例的置信区间,这种争论可能是最极端的。计算这些置信区间的方法很多,但从一种或多种意义上讲都是不准确的,即使是表现最差的方法也受到教科书作者的支持。即使是所谓的“精确”间隔也无法产生预期的置信区间属性。

John Ludbrook和我在为外科医生写的论文中(众所周知,他们对统计学很感兴趣!),我主张使用统一贝叶斯先验方法计算的置信区间的常规使用,因为这种区间的频次性好于任何其他方法(平均而言)覆盖所有真实比例的准确度是95%),但重要的是,覆盖所有观察比例的覆盖度要好得多(准确度是95%)。由于该文档的目标受众非常详尽,因此可能无法说服所有统计学家,但我正在研究具有完整结果和论据的后续论文。

在这种情况下,贝叶斯方法的频度特性与频度方法一样好,这种情况经常发生。先验统一的假设没有问题,因为我遇到的每次常客覆盖率计算都建立了人口比例的统一分布。

您问:“至少在某些情况下,有没有办法查看置信区间,这对统计用户有意义?” 那么,我的答案是,对于二项式置信区间,对于所有观察到的比例,可以得到准确地包含人口比例的时间间隔为95%的间隔。是的。但是,常规使用置信区间期望覆盖所有人口比例,并且答案是“否!”

您对问题的回答的长度以及对它们的各种回答表明,置信区间被广泛误解了。如果我们将目标从所有真实参数值的覆盖范围更改为所有样本值真实参数值的覆盖范围,则可能会变得更加容易,因为间隔将被成形为与观测值直接相关,而不是与观测值的性能相关。方法本身。


5

这是一个很棒的讨论。我认为,贝叶斯可信区间和可能性支持区间以及感兴趣事件(例如,一种药物有效)的贝叶斯后验概率都是可行的方法。但是用置信区间代替P值是一个重大收获。实际上,NEJM和JAMA之类的最好的医学杂志的每一期都在其摘要中出现了“缺乏证据就是缺乏证据”的问题。置信区间的使用将在很大程度上防止此类错误。一个很棒的小文字是http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751


3

直接解决您的问题:假设您正在考虑使用一台机器在谷物盒中填充一定量的谷物。显然,您不想过度填充/未填充盒子。您要评估机器的可靠性。您将执行以下一系列测试:(a)使用机器填充盒子,并且(b)测量盒子中填充的谷物量。

使用收集到的数据,您可以为机器可能填入盒子的谷物数量建立一个置信区间。该置信区间告诉我们,所获得的区间具有95%的概率,它将包含机器将放入盒子中的真实谷物量。如您所说,置信区间的解释取决于所考虑的方法所生成的假设性,看不见的样本。但是,这正是我们所需要的。在上述情况下,我们反复使用机器来填充盒子,因此,我们关心机器在盒子中填充的谷物量的假设性,看不见的实现。

为了摆脱上述背景:置信区间使我们保证,如果我们要重复使用所研究的方法(在上述示例中,方法=机器),则置信区间将具有真实参数的可能性为95% 。


2
μσ2μ

1
@Jyotirmoy当然,特定的配置项可能会偏离。换句话说,CI不包含真实值的可能性为5%。尽管如此,我给出的解释与配置项的实际构造是一致的。我们设想重复使用该方法并构造CI,以使观察到的CI包含真实值的概率为0.95。请注意,我的回答没有说​​明真实值实际位于何处的可能性,因为这是一条只能以可信区间而非置信区间做出的陈述。

1
(100α)H0tz

@Srikant。我也许在答案中误解了“方法=机器”。我以为您是在说,从组装线出来的所有包装箱中有95%的权重在95%的置信区间内,该重量取自特定的包装箱样本。
Jyotirmoy Bhattacharya 2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.