回归系数的逆变换


17

我正在使用转换后的因变量进行线性回归。进行了以下转换,以使残差的正态性假设成立。未转换的因变量产生负偏斜,以下转换使其接近正常值:

Y=50Yorig

其中Yorig是原始量表上的因变量。

我认为在β系数上使用一些转换以使其回到原始比例是有意义的。使用以下回归方程,

Y=50Yorig=α+βX

通过固定,我们有X=0

α=50Yorig=50αorig

最后,

αorig=50α2

使用相同的逻辑,我发现

βorig=α (α2β)+β2+αorig50

现在,对于具有1个或2个预测变量的模型来说,一切工作都很好。逆变换后的系数类似于原始系数,只有现在我可以相信标准误差。问题包括交互项,例如

Y=α+X1βX1+X2βX2+X1X2βX1X2

然后的逆变换与原始比例的逆变换不太接近,我不确定为什么会发生这种情况。我也不确定用于反向转换beta系数的公式是否可以像第三(用于交互项)那样使用。在进入疯狂的代数之前,我想我会寻求建议...βββ


您如何定义和? β ö ř αorigβorig
mark999 2012年

作为原始比例的alpha和beta值
Dominic Comtois

1
但是,这是什么意思?
mark999 2012年

我冒这样的风险:我们得到的估计值是适合线性回归的原始数据。
Dominic Comtois 2012年

2
在我看来,这似乎毫无意义。我同意龚的回答。
mark999 2012年

Answers:


19

一个问题是你写了

Y=α+βX

那是一个简单的确定性(即非随机)模型。在这种情况下,您可以按原始比例对系数进行逆变换,因为这只是一些简单的代数问题。但是,在通常的回归,你只能有 ; 您已将误差项排除在模型之外。如果从变换ýý ö ř 是非线性的,则可能有一个问题,因为ë ˚F X ˚F È E(Y|X)=α+βXYYorig,通常。我认为这可能与您看到的差异有关。E(f(X))f(E(X))

编辑:请注意,如果变换是线性的,则由于期望是线性的,因此可以反向变换以获得原始比例系数的估计。


4
+1解释了为什么我们无法反向转换beta。
gung-恢复莫妮卡

15

我在这里向您致敬,但是您在树错了树。您不支持转换Beta。您的模型保存在转换后的数据世界中。如果你想要做一个预测,例如,你回来变换Ÿ,但仅此而已。当然,您还可以通过计算上下限值来获得预测间隔,然后对它们进行反向转换,但是在任何情况下都不会反向转换beta。 y^i


1
如何解释逆变换系数与对未变换变量建模时获得的系数非常接近的事实?难道不可以推断出原始尺度吗?
Dominic Comtois,2012年

2
完全不知道 它可能取决于许多因素。我的第一个猜测是,您很幸运,有了第一个beta版,但随后运气耗尽了。我必须同意@ mark999,“我们得到的估计值是适合线性回归的原始数据”实际上没有任何意义;我希望它确实如此,乍看起来似乎有点脸红,但不幸的是事实并非如此。并且它不许可在原始比例上进行任何推断。
gung-恢复莫妮卡

1
@gung用于非线性变换(例如box cox):我可以对拟合值以及预测间隔进行逆变换,但不能变换beta或beta的系数间隔。我应该注意其他限制吗?顺便说一句,这是一个非常有趣的话题,在哪里可以得到更好的理解?
莫肯2014年

2
@mugen,很难说您还应该知道什么。可能要记住的一件事是,y-hat的反向转换为您提供了条件中值,而未反向转换(完美)的y-hat是条件均值。除此之外,该材料还应包含在良好的回归教科书中。
gung-恢复莫妮卡

3
@mugen,不客气。通过正常机制随意提出更多问题(单击ASK QUESTION);将会有更多的答案资源,您将得到更多CVer的关注,并且后代可以更轻松地获取该信息。
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.