通用线性模型与广义线性模型(具有身份链接功能?)


25

这是我的第一篇文章,所以如果我不遵循某些标准,请对我放轻松!我搜索了我的问题,但没有任何反应。

我的问题主要涉及通用线性建模(GLM)与广义线性建模(GZLM)之间的实际差异。在我的情况下,与GZLM相比,ANCOVA中将有一些连续变量作为协变量,而有一些因子。我想研究每个变量的主要影响,以及我将在模型中概述的三种交互作用。我可以看到这个假设正在ANCOVA或使用GZLM进行测试。在某种程度上,我了解运行像ANCOVA这样的常规线性模型的数学过程和推理,并且我有点理解GZLM允许使用链接函数来连接线性模型和因变量(好吧,我撒谎,也许我不知道)非常了解数学)。我真正的不 无法理解在GZLM中使用的概率分布是正常的(即,身份链接功能?)时,进行一种分析而不是进行另一种分析的实际差异或原因。当我一个接一个地运行时,我得到了截然不同的结果。我可以跑吗?我的数据有些不正常,但在ANCOVA和GZLM中都可以使用。在两种情况下都支持我的假设,但在GZLM中,p值“更好”。

我的想法是,ANCOVA是一个线性模型,具有使用身份链接函数的正态分布因变量,这正是我可以在GZLM中输入的内容,但是它们仍然有所不同。

如果可以,请为我阐明这些问题!


根据第一个答案,我还有另一个问题:

如果除使用的显着性检验(即F检验与Wald Chi Square)相同以外,是否最合适?ANCOVA是“首选方法”,但我不确定为什么F检验会更可取。有人可以帮我阐明这个问题吗?谢谢!


@onestop的答案是好的;我很久以前就投票了。为了更清楚地了解通用线性模型和广义线性模型之间的联系,它可能会帮助您在此处阅读我的答案:logit和probit模型之间的差异(尽管它是在不同的上下文中编写的) 。假设您的错误是正态分布的,但先验误差的方差未知,则软件将通过w / ANCOVA返回的&测试是正确的;除非您的N很大,否则Wald检验的p值将太低。ŤF
gung-恢复莫妮卡

Answers:


23

指定身份链接函数和正态族分布的广义线性模型与(通用)线性模型完全等效。如果每种方法得到的结果明显不同,则说明您做错了。

请注意,指定的身份链接是一样的东西指定一个正态分布。分布和链接功能是广义线性模型的两个不同组件,可以独立选择每个链接(尽管某些链接在某些分布下效果更好,因此大多数软件包都指定了每个分布允许的链接选择)。

如果残余自由度较小,则某些软件包可能会报告明显不同的值,如果它使用所有广义线性模型的渐近正态分布和卡方分布来计算它们的话。所有软件都将基于普通线性模型的学生和费舍尔报告,因为这些值对于较小的剩余自由度更为准确,因为它们不依赖于渐近线。学生的和费舍尔的分布仅对普通家庭严格有效,尽管其他一些ppŤFŤF 通用线性模型的软件在将其他系列与根据数据估算的比例参数进行拟合时,也可以将其用作近似值。


谢谢您的回复!我很高兴听到您的回答,因为那是我最初的假设。我所在机构的一位教授告诉我否则,我真的不得不去挖掘。我正在使用SPSS,现在看到参数估计的确相同(例如B值)。现在我看到,最初让我感到困惑的是不同的p值。ANCOVA统计基于标准F检验,而GZLM基于Wald卡方,对吗?我已经读到,当您使用样本的参数(例如在GZLM中)时,会使用Wald Chi-Square。
Behacad

基于此答案,我在原始帖子中添加了一个问题!
Behacad

好的,我已经在回答中添加了相应的段落。
一站式

5

我想在这次讨论中吸收我的经验。我已经看到,仅当使用最大似然估计作为比例参数方法时,广义线性模型(指定身份链接函数和正态族分布)才与常规线性模型相同。否则,如果选择“固定值= 1”作为比例参数方法,则会得到非常不同的p值。我的经验表明,通常应避免“固定值= 1”。我很想知道是否有人知道何时选择固定值= 1作为比例参数方法。提前致谢。标记


3
通常情况下,仅对模型进行逻辑回归或泊松回归等模型使用固定比例,其中响应为计数或指标/频率变量。在这种情况下,正常回归中没有类似于比例参数的参数。
Hong Ooi
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.