模型似然不显着高于null时(GAM)回归系数的意义


10

我正在使用R包gamlss运行基于GAM的回归,并假设数据的beta分布为零。我只有一个解释变量在我的模型,所以它基本上是:mymodel = gamlss(response ~ input, family=BEZI)

该算法给了我系数 k 对于解释变量对平均值的影响(μ)和相关的p值 k(input)=0, 就像是:

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

如上例所示, k(input)=0 被高信心地拒绝了。

然后,我运行空模型:null = gamlss(response ~ 1, family=BEZI)并使用似然比检验比较似然:

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

在很多情况下,我得到 p>0.05即使输入的系数据报告非常重要(如上所述)。我发现这很不正常-至少在我的线性或逻辑回归经验中从未发生过(实际上,当我将零调整的伽玛值用于gamlss时也从未发生过)。

我的问题是:在这种情况下,我是否仍然可以相信响应和输入之间的依赖关系?

Answers:


1

我认为没有直接原因将其与GAM相关。事实是您对同一件事使用两个测试。由于统计数据没有绝对的确定性,因此很可能让一个给出显着的结果而另一个则不能。

也许这两个测试之一只是更强大(但是可能依赖于更多的假设),或者唯一有效的测试就是您的20分之一I型错误。

一个很好的例子是检验样本是否来自同一分布:您有非常参数化的检验(T检验可用于此检验:如果均值不同,则分布也应如此)以及非参数检验一个:可能会出现这样的情况:参数之一给出了重要的结果,而非参数结果却没有。这可能是因为该参数测试的假设是错误的,因为数据仅仅是非凡(I型),或者是因为样本大小是不足以使非参数检验拿起差,或者,最后,因为方面的由不同测试检查的真正要测试的内容(不同的分布)只是不同的(不同的意思是<->“高于”的机会)。

如果一个测试结果显示出显着的结果,而另一个仅略微不重要,那么我就不必担心太多。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.