Answers:
如果您有两个相互竞争的估算器和,则告诉您是更好的估算器完全取决于您对“最佳”的定义。例如,如果您要比较无偏估计量,并且用“更好”来表示方差较小,那么是的,这意味着更好。是一种流行的标准,因为它与最小二乘法和高斯对数似然有关,但是,像许多统计标准一样,应注意不要使用 θ 2中号小号ë( θ 1)<中号小号ë( θ 2) θ 1 θ 1中号小号Ë中号小号Ë
在某些情况下,选择估算器以最小化可能不是一件特别明智的事情。我想到两种情况:
如果数据集中有非常大的离群值,那么它们可能会极大地影响MSE,因此使MSE最小化的估算器可能会受到此类离群值的不当影响。在这种情况下,估算器可以最小化MSE的事实并不能告诉您太多信息,因为如果删除异常值,您将获得截然不同的估算值。从这个意义上说,MSE对异常值不是“健壮”的。在回归的情况下,这一事实是促使Huber M-Estimator(我在此答案中讨论)的原因,当存在长尾误差时,它会最小化不同的标准函数(即平方误差和绝对误差之间的混合)。 。
如果您要估计有界参数,则比较可能不合适,因为在这种情况下,它对过度使用和过度使用的惩罚不同。例如,假设您正在估算方差。然后,如果您有意识地低估了的数量最多为,而高估了可能会产生远远超过的,甚至可能是无穷大的数量。σ 2中号小号ë σ 4中号小号ë σ 4
为了更清楚地说明这些缺点,我将给出一个具体示例,说明由于这些问题,何时可能不是评估估算器质量的适当方法。
假设您有一个来自自由度的分布的样本,我们正在尝试估计方差,即。考虑两个相互竞争的估计量: 和显然,而可以使用吨ν > 2 ν /θ 1:吨ħ é ù Ñ b 我一个小号Ë d 小号一米p 升Ë v 一个ř 我一个Ñ Ç ë θ 2 = 0 ,- [R Ë 克一- [R d
最重要的是,在这种情况下,不是适当的度量估计器性能。这很清楚,因为以为主的估计量是荒谬的(特别是因为如果观察到的数据中存在任何可变性,就没有机会证明它是正确的)。也许更合适的方法(如Casella和Berger所指出的)将是选择方差估计量来使斯坦因损失最小化:
对低估与高估均会受到惩罚 由于 :),这也使我们恢复了理智。