从我的结果来看,GLM Gamma似乎可以满足大多数假设,但这是否是对数转换后的LM值得的改进?我发现的大多数文献都涉及泊松或二项式GLM。我发现使用随机化对广义线性模型假设进行评估非常有用,但是缺少用于做出决策的实际图。希望有经验的人可以为我指明正确的方向。
我想对响应变量T的分布进行建模,其分布如下图所示。如您所见,这是正偏度:
。
我要考虑两个类别因素:METH和CASEPART。
请注意,该研究主要是探索性的,本质上是在对模型进行理论化并围绕模型进行DoE之前作为试点研究。
我在R中具有以下模型及其诊断图:
LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)
GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))
GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))
我还通过Shapiro-Wilks残差检验获得了以下P值:
LM.LOG: 2.347e-11
GLM.GAMMA: 0.6288
GLM.GAUS: 0.6288
我计算了AIC和BIC值,但是如果我是正确的话,由于GLM / LM中的族不同,它们并不能告诉我太多。
另外,我注意到了极端值,但是由于没有明确的“特殊原因”,因此无法将它们分类为异常值。