置信椭圆的真实含义

12

阅读有关95％置信椭圆的真实含义的信息，我倾向于碰到两种解释：

包含95％数据的椭圆
不是上面的，而是解释数据差异的椭圆。我不确定我是否理解正确，但是它们似乎意味着，如果有新的数据点出现，则新的方差有95％的机会会保留在椭圆中。

你能阐明一点吗？

confidence-interval ellipse

— 肯尼
source

15

实际上，两种解释都不正确。

置信椭圆与未观察到的总体参数有关，例如双变量分布的真实总体平均值。表示此平均值的95％置信椭圆实际上是一种具有以下属性的算法：如果要多次从基础分布中复制样本，并且每次计算一个置信椭圆，则如此构造的椭圆中的95％将包含基础椭圆意思。（请注意，每个样本当然会产生不同的椭圆。）

因此，置信椭圆通常不会包含95％的观测值。实际上，随着观察次数的增加，通常会更好地估计平均值，从而导致置信椭圆越来越小，而置信椭圆又包含了越来越少的实际数据。（不幸的是，有些人计算出包含其数据的95％的最小椭圆，让人联想到分位数，这本身就可以了……但是后来继续将此“分位数椭圆”称为“置信椭圆”，如您所见，会导致混乱。）

基础总体的方差与置信椭圆有关。高方差意味着数据遍布整个地方，因此均值未得到很好的估计，因此置信椭圆将大于方差较小的情况。

当然，我们也可以为我们可能希望估计的任何其他总体参数计算置信椭圆。或者我们可以查看椭圆以外的其他置信区域，特别是如果我们不知道估计参数（渐近地）呈正态分布时。

置信椭圆的一维模拟是置信区间，浏览此标签中的先前问题非常有帮助。我们当前在这个标签中投票最多的问题特别好：为什么95％的置信度并不意味着95％的机会包含均值？对于一维置信区间的高维类似物，那里的大多数讨论也是如此。

— 斯蒂芬·科拉萨
source

1

这取决于此概念适用的领域。上面所说的对于统计来说是正确的，但是当我们将统计应用于其他主题时，情况就有些不同了。例如，在生物力学中，我们使用术语置信椭圆（尽管存在争论是否应该为预测椭圆）作为一种技术，用于在受试者站在受力平台上时测量压力位移中心。然后，假设围绕两个轴（长轴和短轴）绘制的椭圆包含95％的数据点，这些数据点表示试验期间的压力位移中心。

— 凯瑟琳·卡吉吉安尼
source