为什么限制最大似然会产生更好的(无偏的)方差估计?


11

我正在阅读道格·贝茨(Doug Bates)关于R的lme4程序包的理论论文,以更好地理解混合模型的本质,并遇到了一个我想更好理解的有趣结果,即使用受限最大似然(REML)估计方差。

在关于REML标准的第3.3节中,他指出,在拟合线性模型中根据残差估计方差时,在方差估计中使用REML与使用自由度校正紧密相关。特别是,“尽管通常不是这样得出的”,但可以通过优化“ REML准则”估算方差来推导自由度校正(公式(28))。REML标准基本上只是可​​能性,但是线性拟合参数已通过边缘化来消除(而不是将其设置为等于拟合估计值,这会产生有偏差的样本方差)。

我进行了数学运算,并验证了仅具有固定效果的简单线性模型所声称的结果。我正在努力的是解释。是否存在某种观点,可以通过优化拟合参数被边缘化的可能性来自然地推导方差估计?感觉有点像贝叶斯,好像我认为似然性是后验的,将拟合参数边缘化,就好像它们是随机变量一样。

还是说辩护主要只是数学上的-它在线性情况下有效,但也可以推广?

Answers:


4

方差的偏差源于以下事实:均值是从数据中估算出来的,因此“该数据在此估算均值附近的分布”(即tha方差)小于数据在“真实”均值周围的分布。另请参阅:计算标准偏差时对除的直观解释?n1

固定效应决定了模型的“均值”,因此,如果您可以找到衍生的方差估计,而无需从数据中估计均值(通过“边缘化固定效应(即均值)”),则对这一结果的低估价差(即方差)将得到缓解。

这是“直觉”的理解,为什么REML估计消除了偏差;您无需使用“估计平均值”即可找到方差的估计值。


1

从作者David Dickey 的与SAS相关的资源中查阅附录:REML估计方法。

我们总是可以找到(n-1)个具有已知均值0且与n和Y值相同的平方和理论方差之和的Z。这促使Z平方和除以Zs的个数,即n -1。

当我在读研究生时,REML被认为是自切面包以来最好的东西。通过研究lme4程序包,我了解到它实际上并不能很好地概括出来,也许在总体方案中它并不那么重要。


也许不是。。。尽管如此,数学和统计数据还是很有趣的。
Paul

我同意保罗。我认为REML是在Statistics中解决问题的优雅和创造性的一个很好的例子。它肯定会在实践中得到使用,也许这就是您在统计研究中所希望的。
Ben Ogorek
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.