为什么GLM与带有转换变量的LM不同


16

本课程讲义(第1页)中所述,线性模型可以用以下形式编写:

y=β1x1++βpxp+εi,

其中是响应变量, 是第说明变量。yxiith

通常以满足测试假设为目标,可以转换响应变量。例如,我们在每个上应用log函数。转换响应变量并不等同于执行GLM。yi

可以采用以下形式编写GLM(再次课程讲义中(第3页)

g(u)=β1x1++βpxp+εi,

其中仅仅是另一个符号Ÿ当我从第2页,课程讲义理解。g()称为链接函数。uyg()

在课程中,我不太了解GLM和带有转换后的变量的LM之间的区别。你能帮我吗?


2
您可能会发现考虑到二进制结果的所有变换都是仿射的这一事实很有启发性,从而将您限制在普通的最小二乘回归上。显然,这不是逻辑回归(用于二进制响应的标准GLM)所完成的。(证明:让结果值编码为和,让为任何变换。写和我们发现同意用(是的仿射变换)其中和ÿ 1 φ ž 0 = φ Ý 0Ž 1 = φ Ý 1φ { Ý 0ÿ 1 } ý →交通λ ÿ + μ Ŷ λ = ž 1 - Ž 0/ÿ 1 - ÿ 0μ = ž 0 - λ ÿ 0y0y1ϕz0=ϕ(y0)z1=ϕ(y1)ϕ{y0,y1}yλy+μyλ=(z1z0)/(y1y0)μ=z0λy0。)
whuber

Answers:


15

在执行线性回归之前先转换响应,然后执行以下操作:

E(g(Y))β0+β1x1++βpxp

其中是给定的函数,我们假设具有给定的分布(通常是正态)。g Y gg(Y)

广义线性模型正在执行此操作:

g(E(Y))β0+β1x1++βpxp

其中与以前相同,并且我们假设Y具有给定的分布(通常不是正态)。ÿgY


您的方程式中的E是多少?
user1406647

1
E(X)是用于的期望值的标准符号。X
Marcus PS

我还发现这是很有帮助的:christoph-scherber.de/content/PDF%20Files/...
阿迪亚

22

我不确定这是否可以为您提供一个完整的答案,但它可能有助于摆脱概念上的僵局。

您的帐户似乎有两种误解:

  1. 请记住,普通最小二乘法(OLS-'linear')回归广义线性模型的一种特殊情况。因此,当您说“ [t]转换响应变量不等于进行GLM”时,这是不正确的。拟合线性模型或转换响应变量,然后拟合线性模型都构成“执行GLM”。

  2. 在GLM的标准公式中,您所说的“ ”(通常用μ表示,但这只是一个优先事项)是协变量空间中特定位置(即X)的条件响应分布的平均值。)。因此,当您说“其中u只是y的另一个符号”时,这也是不正确的。在OLS公式中,Y是随机变量,和/或y iY的观测值/研究单位i的实现值。也就是说,y(更一般地)表示数据,而不是参数uμXuyYyiYiy

    (我并不是故意要犯错误,我只是怀疑这些错误可能会引起您的困惑。)

  3. 我没有看到您提到的广义线性模型的另一方面。那就是我们指定一个响应分布。对于OLS回归,响应分布为高斯(正态),链接函数为恒等函数。例如,在逻辑回归中(这可能是人们在想到GLM时首先想到的),响应分布为Bernoulli(/二项式),链接函数为logit。当使用转换来确保满足OLS的假设时,我们经常尝试使条件响应分布可以接受为正态。但是,没有任何这样的变换会使伯努利分布正常。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.