对数链接的Gamma GLM与对数链接的高斯GLM与对数转换的LM


13

从我的结果来看,GLM Gamma似乎可以满足大多数假设,但这是否是对数转换后的LM值得的改进?我发现的大多数文献都涉及泊松或二项式GLM。我发现使用随机化广义线性模型假设进行评估非常有用,但是缺少用于做出决策的实际图。希望有经验的人可以为我指明正确的方向。

我想对响应变量T的分布进行建模,其分布如下图所示。如您所见,这是正偏度:
有效的XHTML

我要考虑两个类别因素:METH和CASEPART。
请注意,该研究主要是探索性的,本质上是在对模型进行理论化并围绕模型进行DoE之前作为试点研究。

我在R中具有以下模型及其诊断图:

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

有效的XHTML
有效的XHTML

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

有效的XHTML
有效的XHTML

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

有效的XHTML
有效的XHTML

我还通过Shapiro-Wilks残差检验获得了以下P值:

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

我计算了AIC和BIC值,但是如果我是正确的话,由于GLM / LM中的族不同,它们并不能告诉我太多。

另外,我注意到了极端值,但是由于没有明确的“特殊原因”,因此无法将它们分类为异常值。



1
值得注意的是,从回归响应的增加与典型响应的相对变化相关的意义上说,所有三个模型都是可乘的。对于两个对数线性GLM,“典型”是指算术平均值,而对于对数转换的LM,我们所讨论的是几何平均值。因此,您想要解释效果和预测的方式也是模型选择的驱动因素,不仅具有完美的残差图(无论如何这些都是数据驱动的)。
Michael M

@MichaelMayer-感谢您的回复,非常有帮助。您能否在选择如何影响解释方面做些扩展?还是指出我的参考方向?
TLJ

@ Marcinthebox-我在发布之前仔细研究了这个问题。不能很简洁地回答我的问题。
TLJ

Answers:


19

好吧,很明显,高斯对数线性拟合是不合适的。残差中存在很强的异方差性。因此,让我们考虑一下。

剩下的就是对数正态与伽玛。

请注意,的直方图没有直接使用,因为边际分布将是变量的混合(每个变量均以预测变量的一组不同值为条件);即使两个模型之一是正确的,该图看起来也不像条件分布。T

在这种情况下,两种模型都几乎同样适用。它们的方差都与均值的平方成正比,因此残差相对于拟合的扩散方式相似。

较低的离群值比使用对数正态分布更好地适合于伽玛值(对于较高的离群值,反之亦然)。在给定的均值和方差下,对数正态偏斜更大,并且变异系数更高。

要记住的一件事是对数正态的期望不是;如果您对均值感兴趣,则不能仅对对数刻度拟合求幂。确实,如果您对均值感兴趣,则gamma避免了对数正态的许多问题(例如,一旦将参数不确定性纳入对数正态中,您就可以基于对数t分布进行预测了,预测间隔仍然可以正常工作,但这可能是预测平均值的问题。exp(μ)σ2

另请参见此处此处的一些相关讨论。


1
@Gleb_b这个答案对我的分析非常有用。我有几个问题。(1)首先,基于残差图和拟合图,这“它们的方差均与均方的平方成正比”吗?(2)根据qq图,这是“较低的离群值将更适合使用伽玛...在给定的均值和方差下,...”吗?(3)据我了解,glm(例如伽马,泊松和负二项式)没有假设残差的正态性和方差的均一性。如果是这样,为什么绘制残差vs拟合图和正常qq图与诊断相关?
榻榻米

2
这足够广泛,可以提出一个全新的问题,或者实际上是几个问题(其中大多数已经在我们的网站上回答了!)-1.模型的一部分。2.不,这些是有关分布的一般事实。3.纠正它们不是正态的,但是QQ图中使用的残差是(内部学习的)偏差残差,尤其是在伽玛射线情况下,它们通常趋向于非常接近正态分布(我写了一个答案,解释为什么在某一点),并且应该具有基本恒定的方差。偏离正常状态并非出乎意料,而是相当大的偏离... ctd
Glen_b-恢复莫妮卡(Monica)17-10-10

2
ctd ...从正态性考虑(假设其他曲线都很好)可能表明分布假设存在问题。
Glen_b-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.