如何解释R中lm公式中的相互作用项?


9

在R中,如果我lm()以以下方式调用该函数:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

这给了我一个带有的响应变量的线性模型var1var2以及它们之间的相互作用。但是,我们如何精确地数字化解释交互作用项?

该文档说这是var1和之间的“交叉” var2,但没有给出“交叉”的确切含义。

知道R正在计算什么确切数字以合并两个变量之间的相互作用,这对我很有帮助。


您是否想具体了解R如何为该公式创建设计矩阵,或者您更广泛地感兴趣于如何根据拟合模型来解释这种乘法(“相互作用”)项?
Momo 2013年

我对如何解释这个乘法术语更感兴趣。例如,如果我想写一个线性公式(一个数学公式,而不是一个R公式...),对于乘法项应该输入什么?
Enzo

要解释交叉的含义,请看一下计算var3 <- var 1 * var2然后进行构建lm.2 <- lm(response ~ var1 + var2 + var3)
James Stanley

1
所以这只是入门级乘法?
Enzo

1
@Enzo,是的,十字架实际上是两个术语的乘积-解释将在很大程度上取决于var1并且var2是否都是连续的(我认为很难解释)还是其中之一是二进制分类的(较容易考虑)。参见以下答案,了解彼得·弗洛姆(Peter Flom)的一些解释示例:stats.stackexchange.com/a/45512/16974
James Stanley

Answers:


8

编写模型预测方程的标准方法是:

ÿ^=b0+b1个X1个+b2X2+b12X1个X2

但是,如果我们以不同的方式考虑这一点,则了解交互会容易一些:

ÿ^=b0+b2X2+b1个+b12X2X1个

有了这个因素,我们可以看到对于给定的值 X2 y截距 X1个b0+b2X2 和斜坡 X1个b1个+b12X2。所以之间的关系ÿX1个 取决于 X2

理解这一点的另一种方法是绘制之间的预测线 ÿX1个 对于不同的值 X2(或相反)。用于R的TeachingDemos软件包中的Predict.PlotTkPredict函数旨在帮助处理这些类型的绘图。


3

假设您得到的点估计为4 X1个,2个 X2和1.5进行交互。然后,等式说lm拟合为

ÿ=4X1个+2X2+1.5X1个X2

那是你想要的吗?


3

用离散变量来考虑相互作用是最容易的。也许您可能已经研究了双向方差分析,其中我们有两个分组变量(例如性别和年龄类别,具有三个年龄级别),并且正在研究它们与某种连续度量(我们的因变量,例如智商)如何相关。

x1 * x2项(如果有意义)可以理解为(在这个琐碎的虚构示例中)IQ在不同性别的年龄水平上表现不同。例如,在这三个年龄段的男性中,智商可能稳定,但年轻女性的年龄要比年轻男性低,并具有向上的轨迹(老年年龄组的平均年龄高于男性年龄组)。在均值图中,这意味着图的中间是男性的水平线,并且可能是女性的45度线,其开始于男性下方,而结束于男性上方。

要点是,当您沿着一个变量(或“保持X1常数”)的水平移动时,另一变量的情况发生了变化。这种解释也适用于连续的预测变量,但是具体说明起来并不容易。在这种情况下,您可能需要获取X1和X2的特定值,并查看Y会发生什么。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.