如本课程讲义(第1页)中所述,线性模型可以用以下形式编写:
其中是响应变量, 是第说明变量。
通常以满足测试假设为目标,可以转换响应变量。例如,我们在每个上应用log函数。转换响应变量并不等同于执行GLM。
可以采用以下形式编写GLM(再次从课程讲义中(第3页))
其中仅仅是另一个符号Ÿ当我从第2页,课程讲义理解。g()称为链接函数。
在课程中,我不太了解GLM和带有转换后的变量的LM之间的区别。你能帮我吗?
如本课程讲义(第1页)中所述,线性模型可以用以下形式编写:
其中是响应变量, 是第说明变量。
通常以满足测试假设为目标,可以转换响应变量。例如,我们在每个上应用log函数。转换响应变量并不等同于执行GLM。
可以采用以下形式编写GLM(再次从课程讲义中(第3页))
其中仅仅是另一个符号Ÿ当我从第2页,课程讲义理解。g()称为链接函数。
在课程中,我不太了解GLM和带有转换后的变量的LM之间的区别。你能帮我吗?
Answers:
在执行线性回归之前先转换响应,然后执行以下操作:
其中是给定的函数,我们假设具有给定的分布(通常是正态)。g (Y )
广义线性模型正在执行此操作:
其中与以前相同,并且我们假设Y具有给定的分布(通常不是正态)。ÿ
我不确定这是否可以为您提供一个完整的答案,但它可能有助于摆脱概念上的僵局。
您的帐户似乎有两种误解:
请记住,普通最小二乘法(OLS-'linear')回归是广义线性模型的一种特殊情况。因此,当您说“ [t]转换响应变量不等于进行GLM”时,这是不正确的。拟合线性模型或转换响应变量,然后拟合线性模型都构成“执行GLM”。
在GLM的标准公式中,您所说的“ ”(通常用μ表示,但这只是一个优先事项)是协变量空间中特定位置(即X)的条件响应分布的平均值。)。因此,当您说“其中u只是y的另一个符号”时,这也是不正确的。在OLS公式中,Y是随机变量,和/或y i是Y的观测值/研究单位i的实现值。也就是说,y(更一般地)表示数据,而不是参数。
(我并不是故意要犯错误,我只是怀疑这些错误可能会引起您的困惑。)
我没有看到您提到的广义线性模型的另一方面。那就是我们指定一个响应分布。对于OLS回归,响应分布为高斯(正态),链接函数为恒等函数。例如,在逻辑回归中(这可能是人们在想到GLM时首先想到的),响应分布为Bernoulli(/二项式),链接函数为logit。当使用转换来确保满足OLS的假设时,我们经常尝试使条件响应分布可以接受为正态。但是,没有任何这样的变换会使伯努利分布正常。