GLM和GAM中的样条


12

仅在GAM模型中提供样条而不在GLM模型中提供样条是错误的吗?我前不久听到了这个消息,想知道这是否只是一个误解,或有什么道理。这是一个例子: http://www.stats.uwo.ca/faculty/bellhouse/glm%20and%20gam.pdf

Answers:


18

你误会了。花键具有使用派生协变量的线性表示。例如,二次趋势是非线性的,但可以通过以下方式在线性模型中建模:E[Y|X]=β0+β1X+β2X2,因此输入了X及其平方变成线性模型

样条可以简单地看作是一个或多个连续或伪连续值协变量的复杂参数化。


感谢您的回答!所以说我错了,就是说样条可以在GLM中使用,对吗?没有完全明白。
HeyJane

是的,一点没错。在R中,导入包splines,然后运行bs(...),您可以使用用户指定的多项式度和结点来创建样条曲线的线性表示。
亚当奥

7
我写了很多关于这个问题在这里:madrury.github.io/jekyll/update/statistics/2017/08/04/...
马修·特鲁

非常感谢你们俩!我现在看到了,AdamO!太棒了,马修,我会读全部!:)
HeyJane's

12

@AdamO的答案是正确的,因为基于样条的拟合当然可以在标准GLM框架中完成。但这并不是说GAM只是GLM的特例!虽然存在一系列完全相同的模型,并且可以将其构建为GAM或带有协变量的样条扩展的GLM,但是有些GAM模型在标准GLM框架中不可用。

例如,可以为每个协变量使用平滑样条拟合GAM模型。这基本上导致变量的样条展开,但对二阶导数造成损失。这导致模型超出了标准GLM框架。

此外,它通常被认为是标准程序,并且内置于大多数GAM库中,以通过优化各种超出样本误差的度量来拟合平滑参数(即样条自由度等),而GLM公式通常考虑协变量空间固定。


我希望我能支持你,但我的观点还不够。感谢您的贡献。我不确定我是否理解您的第二段:您是说平滑样条线只能适合GAM吗?您能否详细说明规则三次样条和平滑三次样条之间的区别是什么?我知道这是很多问题。
HeyJane

@HeyJane:如果您查看Wikipedia页面,您会注意到这些样条线会受到其二阶导数的惩罚。这允许通过连续的惩罚而不是整数的自由度来控制平滑度。这样,它是一个惩罚的最大似然问题,而不是标准的最大似然问题。这意味着您不能直接使用R glm函数拟合它们,这与使用带有glm的标准三次样条曲线不同。
悬崖AB

2
啊哈!我知道了!因此,与其说用正则三次样条而不是说只想让二阶导数在节点处相等,不如说是要对二阶导数施加某些性质,即二阶导数不高,因此惩罚项呢?
HeyJane

@HeyJane:是的,我会说这是一个很好的总结。
Cliff AB
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.