对数转换的预测变量和/或响应的解释


46

我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。

考虑以下情况

log(DV) = Intercept + B1*IV + Error 

我可以将IV解释为百分比增长,但是当我拥有

log(DV) = Intercept + B1*log(IV) + Error

或当我有

DV = Intercept + B1*log(IV) + Error


1
我觉得“增长百分比”的解释是不正确的,但我没有足够的把握来确切地说出原因。我希望有人能提供帮助。...此外,如果日志有助于更好地建立XY关系,我建议使用日志建模,但要使用原始变量报告该关系的选定示例。尤其是在与技术上不太了解的受众打交道时。
rolando2 2011年

3
@ rolando2:我不同意。如果有效模型需要转换,则有效解释通常将依赖于转换模型中的系数。研究人员有责任适当地将这些系数的含义传达给听众。当然,这就是为什么我们得到如此丰厚的报酬,以至于薪水必须首先进行日志转换。
jthetzel

1
@BigBucks:好吧,这样看。假设您的听众无法理解您的意思,当您解释说X的日志(以10为底)的每变化1时,Y都会变化b。但是,假设他们可以使用10、100和1000的X值来理解3个示例。此时,它们很可能会抓住关系的非线性性质。您仍然可以报告基于日志的总体b,但是给出这些示例可能会有所不同。
rolando2 2011年

1
....尽管现在我阅读了您的出色解释,也许使用这些“模板”可以帮助我们许多人消除理解上的这类问题。
rolando2

1
这里的读者可能还想看一下这些密切相关的主题:如何在线性回归中解释对数转换的系数,以及何时以及为什么采用数字分布的对数
gung-恢复莫妮卡

Answers:


42

查理提供了一个很好的,正确的解释。加州大学洛杉矶分校的统计计算站点还有更多示例:http : //www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htmhttp://www.ats.ucla.edu/stat/mult_pkg/常见问题解答/常规/log_transformed_regression.htm

只是为了补充查理的答案,以下是您的示例的具体解释。像往常一样,系数解释假定您可以捍卫模型,回归诊断令人满意并且数据来自有效研究。

示例A:无转换

DV = Intercept + B1 * IV + Error 

“ IV的B1单位增加与DV 的()单位增加相关。”

例B:成果转化

log(DV) = Intercept + B1 * IV + Error 

“ IV的每增加一个单位B1 * 100,DV的增加(%)。”

范例C:曝光转换

DV = Intercept + B1 * log(IV) + Error 

“ IV的增加百分之一与B1 / 100DV 的()单位增加有关。”

例D:成果转化和曝光转化

log(DV) = Intercept + B1 * log(IV) + Error 

“ IV增加1%与B1DV增加()相关。”


1
不管对数的底数如何,这些解释成立吗?
Ayalew A.

示例B:结果转换后的对数(DV)=截距+ B1 * IV +错误“ IV的每单位增加与DV的(B1 * 100)百分比增长有关。在这种情况下,如果您希望30%的百分比减少DV吗?谢谢您的回答
Antouria 2014年

那么DV〜B1 * log(IV)是零界连续因变量的好模型吗?
巴卡堡2015年

2
我可能会感到困惑。如果对结果进行对数转换,则必须重新对系数求幂以找到可乘差。仅在比率非常接近1时,才可以在对数刻度上进行解释
。– AdamO

链接断开。
Nick Cox

22

β1=log(y)log(x).
log(y)y=1y
log(y)=yy.
yx

β1yx

按照相同的逻辑,对于级别日志模型,我们有

β1=ylog(x)=100y100×log(x).
β1/100yx

log(y)=yy?

1
log(y)yyyy1y0yyy

7

线性回归的主要目的是通过比较回归变量的相邻水平来估计结果的平均差异。手段有很多种。我们最熟悉算术平均值。

AM(X)=(X1+X2++Xn)n

AM是使用OLS和未转换的变量估算的。几何平均值不同:

GM(X)=(X1×X2××Xn)n=exp(AM(log(X))

在此处输入图片说明

实际上,GM差异是乘性差异:您在贷款时支付X%的利息溢价,开始使用二甲双胍后血红蛋白水平降低X%,弹簧的故障率增加X%,即宽度的一部分。在所有这些情况下,原始均值差意义不大。

log(y) ~ xβ1Xeβ1

eβ1=0.40

log(x)1xXexp(0.05)1.05Xexp(0.5)=1.65YX

y ~ log(x, base=2)xXβ1

最后,log(y) ~ log(x)简单地应用这两个定义来获得乘数差异,以比较暴露水平成倍增加的组。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.