饱和模型是过拟合模型的特例吗?


10

我试图弄清楚什么是饱和模型。AFAIK就是您拥有的功能与观测值一样多。

我们可以说饱和模型是极端过拟合模型的特例吗?


2
不完全是-我认为饱和模型会耗尽所有自由度。这取决于模型的确切含义。例如,在对数线性模型中,由于模型中包括所有交互,因此饱和度为df = 0,但并未过拟合。
tomka

Answers:


6

@Tomka是的。饱和模型适合给定预测变量集的尽可能多的参数,但是否过度拟合取决于预测变量每种独特模式的观察次数。假设您有一个线性模型,在上有100个观测值,在上有100个观测值。然后,模型是饱和的,但肯定不会过度拟合。但是,如果您对的每一个都有一个观测值,则模型饱和且完美契合-无疑是过度拟合yx=0x=1EY=β0+β1xyx=(0,1,2,3,4)TEY=β0+β1x+β2x2+β3x3+β4x4

当人们谈论饱和模型时,正如链接的Web页面和CV post中所讲的那样,其参数与观察值一样多,他们假设每种预测变量模式都有一个观察值的上下文。(或者也许有时以不同的方式使用“观察”-2×2列联表中的100个人是100个人观察还是4细胞频率观察?)

†顺带一提,请不要直面“确定”和“毫无疑问”。这是可能的第一种模式是相比是如此之小你更好地预测没有试图估计它,和反之亦然第二。β1VarY


很好的示例,x = {0,1}到100 ys的映射,谢谢。您会说这个定义不正确吗:stats.gla.ac.uk/glossary/q = node / 448
里卡多·克鲁兹

我要说的就是我在第二段中所说的-假设上下文和更通用的定义可能更好。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.