对数线性回归与逻辑回归


21

谁能提供清晰的对数线性回归与逻辑回归之间的区别的清单?我知道前者是一个简单的线性回归模型,但是我不清楚何时应使用它们。

Answers:


19

这个名字有点用词不当。对数线性模型传统上用于列联表格式的数据分析。尽管“计数数据”不必一定遵循泊松分布,但对数线性模型实际上只是泊松回归模型。因此,使用“ log”名称(泊松回归模型包含“ log”链接函数)。

线性回归模型中的“对数转换后的结果变量” 不是对数线性模型(如“对数线性”所示,指数结果变量也不是)。对数线性模型和逻辑回归都是广义线性模型的示例,其中模型变量中线性预测变量(例如对数奇数或对数比率)之间的关系是线性的。它们不是“简单线性回归模型”(或使用常规格式的模型)。Ë[ÿ|X]=一种+bX

尽管如此,仍可以使用逻辑回归和泊松回归获得对分类变量之间关联的等效推论。只是在泊松模型中,结果变量被视为协变量。有趣的是,您可以设置一些模型,这些模型以与比例赔率模型非常相似的方式在各个组之间借用信息,但是这种模型尚未广为人知,并且很少使用。

使用R在Logistic和Poisson回归模型中获得等效推论的示例如下所示:

y <- c(0, 1, 0, 1)
x <- c(0, 0, 1, 1)
w <- c(10, 20, 30, 40)

## odds ratio for relationship between x and y from logistic regression
glm(y ~ x, family=binomial, weights=w)

## the odds ratio is the same interaction parameter between contingency table frequencies
glm(w ~ y * x, family=poisson)

ÿX


同样,这可能表明我没有经验,但是您能否为列联表提供定义?它还可能会帮助遇到此问题的其他人。
user38133

列联表(通常)是二维表,它枚举了两个变量的所有可能响应并显示了单元格中观察的频率。例如,您可能有一个2比2的权变表,其中显示了吸烟状况(从不与当前)和癌症(肺癌与无癌症),可用于估计吸烟与癌症风险之间的关联。
AdamO 2014年

15

我认为我不会将它们中的任何一个称为“简单线性回归模型”。尽管可以将log或logit转换用作许多不同模型的链接函数,但通常将它们理解为指的是特定模型。例如,对于响应变量以二项式分布的情况,“逻辑回归”应理解为广义线性模型(GLiM)。此外,“对数线性回归”通常被理解为应用于多向列联表的Poisson GLiM。换句话说,除了它们都是回归模型/ GLiM之外,我认为它们不一定非常相似(@AdamO指出,它们之间存在某些联系,但是典型用法非常不同)。最大的不同是,逻辑回归假设响应以二项式分布,对数线性回归假设响应以Poisson分布。实际上,对数线性回归与大多数回归模型有很大不同,因为响应变量实际上根本不是变量中的一个(通常意义上),而是与变量组合相关的一组频率计数在多向列联表中。


谢谢!我想我的自然后续问题(可能表明我缺乏经验)是关于如何确定对给定问题建模的正确分布。我认为我需要做更多的阅读才能确保我可以始终正确选择。
user38133 2014年

2
{0 1个}

0

为了明确起见,“二进制”逻辑回归具有两个结果的因变量。我的理解是,如果因变量,结果变量具有两个以上类别,则还可以选择使用“多项式”逻辑回归。看这里

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.