误差幅度与置信区间如何相关?


11

有人可以告诉我误差范围和置信区间之间的区别吗?在互联网上,我看到这两种含义可以互换使用。

说的对,

“置信区间显示为1.96,并在图表上显示为误差范围”?


1
可以通过搜索我们的站点找到有关此主题的有用讨论。
ub

Answers:


13

众所周知,互联网到处都是垃圾。它有助于找到权威来源并专注于它们,以帮助解决此类问题。甲小册子在公布的美国统计协会(归因于弗里茨绍伊伦和“彻底更新大约1997”)定义误差界限为95%置信区间(第64页,右)。

鉴于此,令人惊讶的是,尽管维基百科的文章引用了本手册,但它的错误幅度却使用了不同的定义!维基百科写道,

误差范围通常定义为调查中特定统计的置信区间的“半径”(或宽度的一半)。...当报告一项调查的单个全球误差范围时,它指的是使用调查的全部样本得出的所有报告百分比的最大误差范围。

换句话说,对于Wikipedia而言,MoE是组置信区间的最大宽度的一半(覆盖范围可能与95%不同)。

我们已经在本网站其他地方的评论中讨论了这种混乱(至少是缺乏标准化)。我们的结论是,你必须要弄清楚,只要你用这个词的“误差幅度”的意思。


7

关于“误差范围”是什么,没有普遍遵循的约定,但我认为(正如您所观察到的),它最常用于表示置信区间半径,无论是估计的原始比例还是百分比估计。有时,它被用作“标准错误”的代名词,因此您需要小心,以防他人理解您使用它时的意思。

“置信区间” 在其含义上确实具有通用约定。基本上,这是由估计过程生成的可能估计的范围,其中X%的时间(最常用的95%)包含被估计参数的真实值。这种会在X%的时间内产生真实值的“过程”概念有点违反直觉,不会与贝叶斯推断的“可信区间”混淆,后者具有更直观的定义,但与广泛使用的置信区间不同。

您的实际报价有些混乱,并且需要按照所述进行一些小的修复。我会避免额外使用“ margin”一词,而赞成使用“ error bar”。所以:

“置信区间估计为1.96乘以相关的标准误差,并在图表上显示为误差线。”

(这搁置了一个问题,即这是否是一种计算置信区间的好方法,这取决于模型等,并且不相关)。

关于术语的最终评论-我不喜欢“标准误”,它仅表示“估计的标准差”;或通常称为“抽样误差”-我更喜欢从随机性和统计差异方面考虑,而不是“误差”。但是我误用了上面的“标准错误”一词,因为我猜它的使用范围如此广泛。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.