Answers:
实际上,两种解释都不正确。
置信椭圆与未观察到的总体参数有关,例如双变量分布的真实总体平均值。表示此平均值的95%置信椭圆实际上是一种具有以下属性的算法:如果要多次从基础分布中复制样本,并且每次计算一个置信椭圆,则如此构造的椭圆中的95%将包含基础椭圆意思。(请注意,每个样本当然会产生不同的椭圆。)
因此,置信椭圆通常不会包含95%的观测值。实际上,随着观察次数的增加,通常会更好地估计平均值,从而导致置信椭圆越来越小,而置信椭圆又包含了越来越少的实际数据。(不幸的是,有些人计算出包含其数据的95%的最小椭圆,让人联想到分位数,这本身就可以了……但是后来继续将此“分位数椭圆”称为“置信椭圆”,如您所见,会导致混乱。)
基础总体的方差与置信椭圆有关。高方差意味着数据遍布整个地方,因此均值未得到很好的估计,因此置信椭圆将大于方差较小的情况。
当然,我们也可以为我们可能希望估计的任何其他总体参数计算置信椭圆。或者我们可以查看椭圆以外的其他置信区域,特别是如果我们不知道估计参数(渐近地)呈正态分布时。
置信椭圆的一维模拟是置信区间,浏览此标签中的先前问题非常有帮助。我们当前在这个标签中投票最多的问题特别好:为什么95%的置信度并不意味着95%的机会包含均值?对于一维置信区间的高维类似物,那里的大多数讨论也是如此。