当我在回归中包含平方变量时会发生什么?


20

我从我的OLS回归开始: 其中D是虚拟变量,估计值与p值低的零不同。然后,我进行了Ramsey RESET测试,发现我对该方程有一些误称,因此我将平方x包括在内: ÿ = β 0 + β 1 X 1 + β 2 X 2 1 + β 3 d + ε

y=β0+β1x1+β2D+ε
y=β0+β1x1+β2x12+β3D+ε
  1. 平方项解释了什么?(Y非线性增加?)
  2. 通过这样做,我的D估计值不再从零变化,而具有较高的p值。我如何解释方程式中的平方项(通常)?

编辑:改善问题。



1
可能的原因:和似乎在解释了相同的可x12Dy
变性

3
可能有帮助的一件事是创建平方项之前将居中(请参阅此处)。至于你的平方项的解释,我认为它是最好的诠释作为一个整体(见这里)。另一件事是,您可能需要进行交互,这意味着添加。x β1x1+β2x12 β4x1D+β5x12D
gung-恢复莫妮卡

我不认为这确实是该问题的重复;解决方案是不同的(除非我误解,否则中心变量在这里起作用,但在那里不起作用)
彼得·弗洛姆-恢复莫妮卡

@Peter,我将这个问题解释为“为什么当我向模型中添加变量时,某些其他变量的影响估计值/ 值会发生变化?”的子集,在另一个问题中得到了解决。在这些问题的答案中有共线性(gung在他对这个问题的回答中确实暗示了这一点)/预测变量之间的内容重叠(即Dx 1x 2 1)之间,我怀疑是这种情况的罪魁祸首) 。同样的逻辑在这里适用。我不确定争议是什么,但是如果您和其他人不同意,那就很好。干杯。pD(x1,x12
2013年

Answers:


21

好吧,首先,哑变量被解释为截距的变化。也就是说,你的系数给你在截距之差,当d = 1时,即当d = 1,截距β 0 + β 3。当加平方x 1时,这种解释不会改变。β3D=1D=1个β0+β3X1个

现在,向序列添加平方的点是,您假定关系在某个点消失了。看你的第二个方程

ÿ=β0+β1个X1个+β2X1个2+β3d+ε

X1个

δÿδX1个=β1个+2β2X1个

β1个<0

ÿ^=1.3+0.42X1个-0.32X1个2+0.14d

X1个

δyδx1=0.4220.32x1

x1

δyδx1=0x10.66

这是关系具有转折点的时刻。您可以查看上述功能的Wolfram-Alpha输出,以直观地了解您的问题。

x1y

Δy=(β1+2β2x1)Δx

β1x12

Dx1


你好 如果您有多个预测变量,则应使用偏导数还是全导数(微分)?
skan

1
偏导数仍然是正确的选择。所有系数的解释都是塞特里斯·帕里布斯,即保持其他所有不变。这就是您采用偏导数时所做的。
altabq

请参阅此UCLA IDRE页面,以补充@altabq的出色答案。
Cyrille

19

包括变量平方的一个很好的例子来自劳动经济学。如果您假设y工资(或工资的对数)和x年龄,则包括在内x^2意味着您正在测试年龄与工资收入之间的二次关系。随着人们的经验增加,工资随着年龄的增长而增加,但是随着年龄的增长,工资开始以下降的速率增加(人们变得越来越老,他们将无法像以前那样健康地工作),并且在某些时候工资没有增长(达到最佳工资水平),然后开始下降(退休,收入开始下降)。因此,工资与年龄之间的关系呈倒U形(生命周期效应)。通常,对于此处提到的示例,系数on age预期为正,而不是age^2这里的要点是包含变量的平方应该有理论基础/经验依据。在这里,虚拟变量可以被认为代表工人的性别。您还可以包括性别和年龄的交互条件,以检查性别差异是否随年龄变化。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.