在两个变量的对数之间具有线性关系的直观含义是什么?


20

我有两个变量,当按原样相互绘制时,它们并没有显示出太多的相关性,但是当我绘制每个变量的对数时,它们之间却呈现出非常清晰的线性关系。

所以我最终得到一个类型的模型:

log(Y)=alog(X)+b
,在数学上很棒,但是似乎没有常规线性模型的解释价值。

如何解释这样的模型?


5
对于现有的答案,我没有什么实质性的补充,但是结果的对数和预测变量是弹性。搜索该术语应找到一些很好的资源来解释这种关系,这不是很直观。
Upper_Case-Harming莫妮卡

对数-对数模型的解释为:,因变量为log(y),自变量为log(x)%Δ=β1%Δx
鲍勃

3
当结果是二进制(风险模型)并且暴露是累积的(例如性伴侣数量与HIV感染)时,互补的log-log链接是理想的GLM规范。jstor.org/stable/2532454
AdamO

2
@Alexis,如果覆盖曲线,则可以看到粘滞点。尝试curve(exp(-exp(x)), from=-5, to=5)curve(plogis(x), from=-5, to=5)。凹面加速。如果一次遭遇事件的风险为p,则第二次事件之后的风险应为1(1p)2,依此类推,这是概率形状logit无法捕获的。高的高暴露量将使逻辑回归结果更加明显地倾斜(错误地根据先前的概率规则)。一些模拟将向您显示。
AdamO

1
@AdamO可能会写一篇包含这样的模拟的教学论文,以激发如何从三个之中选择一个特定的二分结果链接,包括它有或没有区别的情况。
Alexis

Answers:


27

您只需要对等式两边都取指数,就可以得到潜在的关系,这对某些数据可能是有意义的。

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

并且由于只是可以采用任何正值的参数,因此该模型等效于:eb

Y=cXa

应当注意,模型表达式应包括误差项,并且变量的这些变化对其具有有趣的影响:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

也就是说,您的模型具有符合OLS条件的加性误差(具有恒定方差的正态分布误差)等效于具有乘法误差的潜在模型,其对数遵循具有恒定方差的正态分布。


3
OP可能有兴趣知道此分布有一个名称,即对数正态:en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
詹森不平等的影响如何?通常对于凸g,E[g(X)]g(E[X])
统计数据

14

您可以采用模型并计算总差,最终会得到类似 结果 log(Y)=alog(X)+b

1YdY=a1XdX
dYdXXY=a

因此,系数的一个简单的解释将在百分比变化用于在变化百分比。此外,这意味着变量以的增长率的恒定比率()增长。aYXYaX


因此,如果对数-对数图是线性的,那意味着增长率恒定吗?
Dimitriy V. Masterov

实际上,当且仅当,的增长率将是恒定的。Ya=0
RScrlli

不随时间推移,相对于x增长率的增长率。
Dimitriy V. Masterov

重新排序无济于事,我将其删除
Aksakal

1
@ DimitriyV.Masterov好,然后,由于在是线性的,这意味着变量以的增长率的恒定分数增长。根据您的回答,我的答案有问题吗?log(Y)log(X)YX
RScrlli

7

直观地,给出了变量的数量级,因此我们可以将关系视为两个变量的数量级线性相关。例如,将预测变量增加一个数量级可以与响应的三个数量级的增加相关联。log

使用对数-对数图进行绘制时,我们希望看到线性关系。使用此问题的示例,我们可以检查线性模型假设:

日志日志


3
+1为一个不直观的概念提供直观的答案。但是,您包含的图像显然违反了整个预测变量的恒定误差方差。
弗朗斯·罗登堡

1
答案是正确的,但作者身份归属是错误的。该图片不应归因于Google图片,而至少应归因于该图片所在的网页,只需点击Google图片即可找到该图片。
佩雷

@Pere很遗憾,我找不到图像的原始来源(至少使用反向图像搜索)
qwr

它似乎最初来自diagramss.us,尽管该网站已关闭,并且除主页
Henry

4

将@Rscrill的答案与实际离散数据进行协调,请考虑

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1是周期和之间的的百分比变化,或的增长率,例如。当它小于,我们可以接受的近似值为Yt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

因此我们得到

gYtagXt

这在实证研究中验证了@Rscrill的理论处理。


1
这可能是数学家所称的直觉 :)
理查德·哈迪

2

对数之间的线性关系等效于幂定律的依赖关系: 在物理学中,这种行为意味着系统是无标度的或标度不变的。例如,如果是距离或时间,则意味着对的依赖关系无法通过特征长度或时标来表征(与指数衰减相反)。结果,这种系统表现出对的长期依赖性。

YXα
XXYX

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.