如何选择置信度?


12

我经常使用90%的置信度,因为它比95%或99%具有更大的不确定性。

但是,关于如何选择正确的置信度水平有任何指导原则吗?还是不同领域使用的置信度准则?

此外,在解释和显示置信度时,是否有任何指南将数字转换为语言?例如,诸如针对Pearson's r的指南(编辑:这些描述适用于社会科学):

http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html

更新资料

感谢您下面的回答。他们都很乐于助人,有见地和有启发性。

此外,以下是一些不错的文章,这些文章是我在研究此问题时遇到的有关选择重要性级别(基本上是同一问题)的文章。他们验证以下答案中的内容。

“ 0.05的显着性意义是什么?”

http://www.p-value.info/2013/01/whats-significance-of-005-significance_6.html

“关于.05级统计意义的起源”

http://www.radford.edu/~jaspelme/611/Spring-2007/Cowles-n-Davis_Am-Psyc_orignis-of-05-level.pdf

“科学方法:统计错误”

http://www.nature.com/news/scientific-method-statistical-errors-1.14700

Answers:


9

除了蒂姆的出色答案之外,对于一个特定的置信区间,甚至在一个领域内还有不同的原因。例如,在一项针对发胶的临床试验中,您将非常有信心说治疗不会杀死任何人,比如说99.99%,但是以75%的置信区间(使发胶保持发质),您会很好的。直行。

通常,置信区间的使用方式应使您对不确定性感到满意,但又不要太严格,以免将研究的能力降低为不相关的。90%的置信区间意味着在重复采样时,您期望生成的十次间隔中的一次不会包含真实值。根据您的研究,可以接受吗?另一方面,如果您希望使用99%的置信区间,则样本量是否足以确保区间不会变得无用大?(希望您在研究之前确定CI水平,对吗?)

根据我的经验(在社会科学领域)以及从我对妻子的看法(在生物科学领域)来看,尽管在各个领域和各种特定情况下都有CI /重要性排序标准,但对于关于某个主题的辩论主要是您是否适当设置了CI间隔或重要性级别。我参加过一次会议,统计学家耐心地向客户解释说,尽管他们可能希望99%的双向置信区间,但他们的数据要显示出重要性,就必须将其样本增加十倍。我参加过一次会议,客户问为什么他们的数据没有一个显示出显着差异,我们耐心地向他们解释这是因为他们选择了一个较高的时间间隔,或者相反,因为要求的时间间隔较短,所以一切都很重要。

我的建议是阅读您所在领域的一些主要论文(尽可能接近您的特定主题)并查看它们的用途;结合您的舒适度和样本量;然后准备利用这些信息来捍卫您的选择。除非您在一个非常严格的规则领域中-至少从我所看到的情况来看,我怀疑只有严格的严格的临床试验-您将无法得到更好的结果。(如果有严格的规定,我希望您领域中的主要论文都遵循它!)


5
市场上有成千上万的发胶。我想我们希望他们都不杀人。这显得过于宽松。;)α
Alexis

2
@Alexis不幸的是,对于每千名用户,其中一个很可能会忘记
Joe

2
“ 90%的置信区间意味着您有十分之一的时间会发现异常值。” 这是完全错误的,除非我误读了您
shadowtalker 2015年

2
90%CI表示90%的总体平均值在置信区间内,而10%的概率在区间的另一侧(一侧或另一侧)。因此,十分之一的时间,您的发现不包括真实的均值。也许“离群值”是一个错误的词(尽管配置项通常(错误地)用于此目的。)
Joe Joe

@Joe,我知道这是一个旧的评论部分,但这是错误的。您可以拥有任何级别的“置信度”(从未包含真实值)的配置项。看到这里:stats.stackexchange.com/a/26457/176202
弗朗斯·罗登堡

20

选择置信区间范围是一个主观决定。您可以选择任何置信区间:50%,90%,99,999%...等。这取决于想要拥有多少置信度。可能最常用的是95%CI。

关于解释和您提供的链接...这些解释过于简单化。关联是一个很好的例子,因为在不同的上下文中,不同的值可以被认为是“强”或“弱”的关联,请从网络上看一些随机的例子

  • 我曾经问过一个化学家,他正在将实验室仪器校准到一个标准,她正在寻找什么相关系数值。“ 0.9太低。您至少需要0.98或0.99。” 她从政府指导文件中获得了电话号码。
  • 我曾经问过一个对治疗过程进行回归分析的工程师,他在寻找什么相关系数值。“ 0.6到0.8之间的任何值都是可以接受的。” 他的大学教授告诉他。
  • 我曾经问过一位生物学家,他正在对生活在污染土壤和原始土壤中的田鼠大小进行方差分析,他在寻找什么相关系数值。他不知道,但是根据模型可以检测到的最小尺寸差(基于他拥有的样本数量),他的截止值为0.2。

很抱歉,但是没有捷径...

为了更好地了解什么是置信区间,您可以在这里这里这里阅读更多关于他们的信息


1
不错的引用。+1。
变形虫说莫妮卡(

您说的相关描述是正确的。这完全与现场相关。链接中的描述适用于社会科学。我想对置信区间的描述也将取决于字段。
奥利弗·莫兰

9

尽管一般而言,置信水平由分析师自行决定,但在某些情况下,法律和法规会设定这些置信水平。我给你举两个例子。

在银行监管中,计算某些风险时必须使用99%的置信度,请参阅本巴塞尔法规第2页。

FDA 可能会指示在其统计方法中对药物和设备测试使用一定的置信度。

总的来说,最好是咨询您所在领域的专家,以了解有关可信度水平的公认做法和法规。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.