我没有特定的示例或任务。我只是使用b样条的新手,我想在回归上下文中更好地了解此函数。
假设我们要评估响应变量与某些预测变量x 1,x 2,...之间的关系。。。,X p。预测变量包括一些数值变量和一些分类变量。
假设在拟合回归模型后,数值变量之一(例如是有效的。之后的逻辑步骤是评估是否需要更高阶的多项式,例如:x 2 1和x 3 1,以便在不过度拟合的情况下充分说明该关系。
我的问题是:
在什么时候选择b样条曲线或简单的高阶多项式。例如在R:
y ~ poly(x1,3) + x2 + x3
与
y ~ bs(x1,3) + x2 + x3
您如何使用图来告知您在这两者之间的选择,以及从图上还不清楚时会发生什么情况(例如:由于大量数据点)
您将如何评估和x 3之间的双向交互作用项
对于不同类型的模型,上述变化如何
您是否会考虑从不使用高阶多项式并始终拟合b样条并惩罚高灵活性?
mgcv
,为什么不使用(通用)加性模型。平滑度选择是自动的,推理方法也很完善。