从模型中删除项后的适当剩余自由度


27

我正在反思有关该问题的讨论,尤其是弗兰克·哈雷尔(Frank Harrell)的评论,即简化模型(即已测试并拒绝了许多解释变量的模型)中的方差估计应使用Ye的广义自由度。哈雷尔教授指出,与最终模型(其中许多变量已被拒绝)相比,这将更接近原始“完全”模型(包含所有变量)的剩余自由度。

问题1。如果我想对简化模型中的所有标准摘要和统计数据使用适当的方法(但未全面实施广义自由度),一种合理的方法是仅使用来自以下模型的剩余自由度:我的剩余方差估算中的完整模型等?

问题2。如果上述情况是正确的,并且我想在中进行操作R,那么它可能像设置一样简单

finalModel$df.residual <- fullModel$df.residual

在模型拟合练习中的某个时刻,使用lm()或类似函数创建了finalModel和fullModel。之后,诸如summary()和confint()之类的函数似乎可以与所需的df.residual一起使用,尽管返回的错误消息表明有人显然已经对finalModel对象进行了修改。


8
好问题。这与为什么道格拉斯·贝茨(Douglas Bates)在lmer输出中不包含p值有关。在这里看到他的推理。

2
我已经多次看到在这种情况下使用完整的df模型。(是的,在不同情况下会出现很多方法;这是我经常向人们推荐的论文。拥有一些通用但有效的R函数,很多函数都可以利用会很好。)
Glen_b-恢复Monica

Answers:


3

无论如何,您是否不同意@FrankHarrel的回答,即简约带来了一些丑陋的科学取舍?

我喜欢@MikeWiezbicki评论中提供的指向道格·贝茨(Doug Bates)原理的链接。如果有人不同意您的分析,他们可以按自己的方式做,这是开始对您的基本假设进行科学讨论的一种有趣方式。p值不会使您的结论成为“绝对真理”。

如果是否在模型中包括参数的决定归结为“挑毛”,对于具有科学意义的样本,df中的差异相对较小-并且您没有处理问题无论如何,只要有了更细微的推断,那么您的参数就非常接近满足您的要求,您应该透明并以任何一种方式谈论它:只包括它,或者分析有或没有它的模型,但是绝对透明地讨论您的决策归根结底。 ñ<p


2
+1,我现在倾向于同意,事实上,鉴于其他问题,我最初的问题并不那么重要
彼得·埃利斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.