置信椭圆的真实含义


12

阅读有关95%置信椭圆的真实含义的信息,我倾向于碰到两种解释:

  1. 包含95%数据的椭圆
  2. 不是上面的,而是解释数据差异的椭圆。我不确定我是否理解正确,但是它们似乎意味着,如果有新的数据点出现,则新的方差有95%的机会会保留在椭圆中。

你能阐明一点吗?

Answers:


15

实际上,两种解释都不正确。

置信椭圆与未观察到的总体参数有关,例如双变量分布的真实总体平均值。表示此平均值的95%置信椭圆实际上是一种具有以下属性的算法:如果要多次从基础分布中复制样本,并且每次计算一个置信椭圆,则如此构造的椭圆中的95%将包含基础椭圆意思。(请注意,每个样本当然会产生不同的椭圆。)

因此,置信椭圆通常不会包含95%的观测值。实际上,随着观察次数的增加,通常会更好地估计平均值,从而导致置信椭圆越来越小,而置信椭圆又包含了越来越少的实际数据。(不幸的是,有些人计算出包含其数据的95%的最小椭圆,让人联想到分位数,这本身就可以了……但是后来继续将此“分位数椭圆”称为“置信椭圆”,如您所见,会导致混乱。)

基础总体的方差与置信椭圆有关。高方差意味着数据遍布整个地方,因此均值未得到很好的估计,因此置信椭圆将大于方差较小的情况。

当然,我们也可以为我们可能希望估计的任何其他总体参数计算置信椭圆。或者我们可以查看椭圆以外的其他置信区域,特别是如果我们不知道估计参数(渐近地)呈正态分布时。

置信椭圆的一维模拟是,浏览此标签中的先前问题非常有帮助。我们当前在这个标签中投票最多的问题特别好:为什么95%的置信度并不意味着95%的机会包含均值?对于一维置信区间的高维类似物,那里的大多数讨论也是如此。


1

这取决于此概念适用的领域。上面所说的对于统计来说是正确的,但是当我们将统计应用于其他主题时,情况就有些不同了。例如,在生物力学中,我们使用术语置信椭圆(尽管存在争论是否应该为预测椭圆)作为一种技术,用于在受试者站在受力平台上时测量压力位移中心。然后,假设围绕两个轴(长轴和短轴)绘制的椭圆包含95%的数据点,这些数据点表示试验期间的压​​力位移中心。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.