正交互作用项是否暗示其构成变量之间的相关性?


9

假设我正在运行线性回归,其形式为。y=β0+β1A+β2B+β3AB+ϵ

如果β3为正,是否表示AB之间为正相关B?(相反,如果β3为负,是否为负相关?)


5
这是一个很好的模拟问题示例。生成一些随机的A,B,y数据,您应该能够很快找到一些反例。另外,请注意,双线性插值通常在xy正交的网格上完成,并且“交互项”可以具有任意符号。
GeoMatt22 2016年

5
实际上,仅根据此模型创建数据集的想法就应该明确地回答这个问题。为什么不生成不相关的变量(Ai,Bi),独立错误ϵi并选择所需的beta值。为每个i计算y_i的值是否有任何障碍?如果不是,则\ beta_3的值不暗示AB的相关性。(cc @ GeoMatt22)yiiβ3AB
呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜呜祖褐定量同钉同

Answers:


12

不,非零并不意味着和是相关的。这意味着与相关。β3AByAB

简单的例子:

想象一下,我们有关于人们访问加油站的数据。

  • 令为某人的汽油罐的体积(加仑)。A
  • 令为访问时的汽油价格。B
  • 令为这次访问的汽油费用。y

AB是填充该人的汽油箱需要多少费用。几乎可以肯定与(此访问的汽油支出)相关。ABy

在这个小例子中,一个正的并不意味着某人的油箱尺寸与汽油价格相关。正表示支出与以美元(即)衡量的某人的油箱的承载能力为正。β3β3yAB


9

这是一个潜在的应用反例:假设是性别,是受教育的年限,是劳动力市场的收入。因此,举例来说,经过12年的中小学教育和3年的学士学位,您将完成15年的教育。ABy

然后,不能完全假设和不相关-过去,男人曾经拥有更高的学位,如今(如果有的话)是女人。因此,在过去(不那么遥远)中,性别和受教育年限可能是不相关的,而今天的相关性当然并不强。AB

但是,要证明,因为额外一年的受教育可能对男性和女性的收入产生不同的影响。β30

例如,在大多数受过高等教育的员工的工作中,存在工资“歧视”(引号是一个备受争议的问题)时就是这种情况。有证据表明,情况可能是这样,因为男性高管的薪酬往往比女性高。另一方面,工会和雇主协会之间的广泛协议(至少在欧洲大陆这样)可以更频繁地确定需要较少教育的工作的薪水,从而留出了较少的工资歧视空间。

(例如,引号可以由以下事实证明是正确的,即这个简单的故事并未说明行业,经验等)


您的示例中的“学校教育”是什么?我看了字典,这个词似乎有多种含义。
ttnphns

1
谢谢,我进行了编辑。我太根深蒂固于经济学行话……
Christoph Hanck

抱歉,我的回答很简单,因为它添加了太多的信息,而这些信息并不能使我感到困惑。除此之外,它还使我们假设A和B可能是不相关的,而事实并非如此,因此令我感到反常。
丹尼斯·贾赫鲁丁

好吧...如果您想说明该示例不需要哪些部分?同样,假设的性质可能不成立,并且相当明确地表明这一特定事实可能成立或可能成立。但除此之外,如果您认为不赞成,则无需道歉。
Christoph Hanck
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.