线性回归的因变量是比率


10

我正在进行线性回归,其中因变量的比率范围为0.01到100。

是否可以对因变量和对数进行对数取对数?我正在匹配一项研究的结果,这就是他们所做的。

取对数与按原样使用比率有什么区别?


我正在寻找房价评估。我的独立变量是评估房屋价格除以销售价格。我的因变量是几个种族类别(黑人,白人,西班牙裔和亚裔的百分比)和家庭收入中位数。我发现黑人比例更高的普查区对销售价格的评估率要高于其他地区。
亚伦·克里德

为什么不使用逻辑回归?您可以定义比率,因为您的因变量包含许多统计数据包。
statnoobie1 2014年

1
Logistic回归通常用于二进制值或比例(介于0和1之间)。这是在这里不适用,因为该比率可以超过1
马克斯Ghenis

Answers:


9

当您获取比率的对数时,请记住那是什么: 使用此值作为因变量在您的问题中有意义吗?log(ab)=log(a)log(b)

现在,关于使用原始比率-这可能会出现问题。Kronmal 1993提出这样一个论点,即以比率作为因变量的回归: ,可以描述为 是
YZ=α0+αXX+ϵ

Y=Z1nα0+ZXαX+Z1ϵ

Y=β0+βXX+Z1nα0+ZXαX+Z1ϵ

又名...

  • 用原始自变量,分母和分母乘以原始变量的回归分子
  • 通过(反)分母进行权重回归

仅在和为零的情况下,原始回归模型才有效。β0βX

警告-我也不相信我对比率有完整的了解。


您是否假设一个固定的Z?我有27,000箱(aka财产),每个Y(评估价格)和Z(销售价格)不同。
亚伦·克莱德

不,Z是nxn对角矩阵,对角线是您的销售价格。我在第一个方程式中的表示法可能会令人困惑,因为它没有使用矩阵表示法。将与其余的一致。Z1Y=α0+αXX+ϵ
仿射

好。我查看了您的链接问题中建议的方法,它们很有意义。我对此了解不足,无法以一种或另一种方式推荐他们,但是如果有人确认了您的建议,我可以尝试一下。
亚伦·克里德
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.