如何在多元回归分析中使用


13

下图是回归测试的残留散点图,对于这些测试,可以肯定已经满足“正态性”,“均方差性”和“独立性”的假设!为了测试“线性”假设,尽管通过查看图表可以推测出该关系是曲线的,但是问题是:“ R2线性”的值如何用于测试线性假设?“ R2线性”值确定该关系是否为线性的可接受范围是什么?如果不满足线性假设并且对IV进行转换也无济于事怎么办?

是测试完整结果的链接。

散点图:

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明


3
从图表的外观可以看出您正在使用SPSS。只需打开图形进行编辑,然后找到“添加拟合线按钮”,即可在其中找到一些非线性的线描选项,例如黄土。检查此选项是否给您合理的直线。
ttnphns

@ ttnphns:我在黄土第2行中添加了地块的问题。
赛勒斯(Cyrus)2012年

好吧,它看起来很曲线,不是吗?您可以使用Loess参数玩更多游戏,看看会发生什么。如果线是弯曲的,则可以从视觉上断定该关系不是线性的。
ttnphns

xy

@ ttnphns:是的,它是曲线的。我不知道该如何对待这个模型!在此测试中(#2),我有2个直接影响DV(PIT)的IV。回归结果显示,只有四分之一的静脉注射对DV有显着影响。R2非常低(0.172),线性也很低(至少根据该图,当IV处于低电平时)。我不知道这个测试是否可以接受!甚至我都转换了两个IV(通过计算其LN)并重新运行了回归,但结果变得更糟!
赛勒斯(Cyrus)

Answers:


15

YiXiR2

R2XY

  • R2

  • R2

我将依次讨论每个:

R2X1,...,Xn99%M1%

Yi={Ziif XiMMif Xi=M

ZiN(μ,1)Mμμ=0,M=105XiYi

u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1

YiXiYiXiXi=M

R2XiYi

Yi=β0+β1Xi+εi

YiXiXivar(εi)=σ2β1R2

x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698

R2

回复:当不满足线性假设并且对IV进行转换也无济于事时该怎么办?

当非线性成为问题时,查看残差与每个预测变量的关系图可能会有所帮助-如果存在任何明显的模式,则可以指示该预测变量中的非线性。例如,如果此图揭示了残差与预测变量之间的“碗形”关系,则可能表明该预测变量中缺少二次项。其他模式可能表示不同的功能形式。在某些情况下,可能是您没有尝试正确的变换,或者真实模型在变量的任何变换版本中都不是线性的(尽管有可能找到合理的近似值)。

R2


4

R2=11R2R221<x<2R2R2


谢谢迈克尔。我的样本大小为302。如果您可以在这里查看测试结果,并查看报告的合理性和可行性,我将不胜感激。TQ
Cyrus

@Cyrus这是一个艰难的过程。残差看起来很符合正常情况,线性回归没有什么错。您拥有大量数据。由于随机噪声分量较大,因此R square低。LOESS图在自变量的较低值处显示一些曲率。但是我没有那种说服力。我认为它很可能是线性的,它说明了为什么在这种情况下R平方不是一个好的指标。
Michael R. Chernick

Tq Michael :)是的,真的很困惑!满足所有假设但线性!如您在上面的第一张图中看到的那样,二次R2(0.199)大于线性R2(0.172),这意味着它可以更好地预测模型。实际上,当我进行二次回归(通过添加SC2)时,结果中的散点​​图太杂了!我很困惑!不知道该怎么办!唯一的问题是线性度低。如果将散点图放入报告中,我不知道如何证明线性。二次回归也未能满足均质性假设。帮助
赛勒斯(Cyrus)2012年

1
我不觉得这很困惑。它看起来很线性。有很多可变性,这就是为什么R方低。我认为减少变异性的唯一方法是找到解释性变量。
Michael R. Chernick
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.