如何解释GAM P值?


10

我叫休,我是一名使用广义加性模型进行探索性分析的博士研究生。

我不确定如何解释来自MGCV软件包的p值,并想检查我的理解(我使用的是1.7-29版,并已查阅了Simon Wood的一些文档)。我首先寻找了其他简历问题,但最相关的问题似乎与一般回归有关,尤其不是GAM p值。

我知道GAM有很多不同的参数,而p值仅是近似值。但是,我只是简单地开始看看我的协变量是否存在任何“信号”。例如:

Y〜s(a,k = 3)+ s(b,k = 3)+ s(c,k = 3)+ s(d,k = 3)+ s(e,k = 3)

平滑项的近似p值:

s(a)= 0.000473
s(b)= 1.13e-05
s(c)= 0.000736
s(d)= 0.887579
s(e)= 0.234017

ř ²(调整)= 0.62 解释的偏差= 63.7%
GCV分数= 411.17 规模估算值= 390.1 n = 120

由于格式化,我剪切了df列等。我将每个协变量的p值解释为测试相应的平滑函数是否显着降低模型偏差,其中p是获得数据的概率至少与在零模型0下观察到的“相对不可信”。

这将意味着(例如,在alpha = 0.05的情况下)与零模型相比,平滑函数不会减小“ d”和“ e”的偏差,而对于其他项却会减小。因此,(d)和(e)不会在回归中添加重要信息,并且解释的偏差可归结为(a)(b)(c)?

任何建议将不胜感激,并祝您研究顺利。

Answers:


8

描述它们如何工作的论文在这里

它们是与Wald检验相关联的p值,整个函数s(。)=0。低p值表示组成函数的样条共同为零的可能性很小。

关于它们的复杂之处在于它们涉及到降秩的伪逆。典型的Wald测试是F^Vβ-1个F^。您可以立即看到这是单变量情况下的t检验(即,不是矩阵,而是beta和方差)。在受罚样条的情况下,这会产生非常低的功效,因为这些coefficeints受了惩罚。rank-r伪逆说明了这一点。论文确实非常密集,但是一旦掌握了基本要点(通过考虑EDF而不是矩阵等级来提高测试的功能),就可以遵循形式主义。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.