在没有交互项的模型中(即,没有构造为其他项的乘积的项),每个变量的回归系数是回归表面在该变量方向上的斜率。它是恒定的,与变量的值无关,因此可以说是衡量该变量的整体效果。
在具有交互作用的模型中,可以仅对不涉及任何交互作用的那些变量进行进一步解释,而无需进行进一步的限定。对于涉及相互作用的变量,“主效应”回归系数(即变量本身的回归系数)是当所有其他变量均满足时,回归表面在该变量方向上的斜率与该变量交互具有零值,并且系数的显着性检验是指仅在预测变量空间的那个区域中回归曲面的斜率。由于不需要在该空间的该区域中实际存在数据,因此主效应系数可能与实际观察到数据的预测器空间的区域中的回归表面的斜率几乎没有相似之处。
用方差分析来说,主效应系数类似于简单的主效应,而不是总的主效应。此外,它可以指的是在方差分析设计中什么是空单元格,其中通过从单元格中推断数据来提供数据。
为了测量变量的总体效果,该变量类似于方差分析中的总体主效果,并且不会外推到观察到数据的区域之外,我们必须查看回归表面在变量方向上的平均斜率,其中平均值超过实际观察到的N个案例。该平均斜率可以表示为模型中所有涉及变量的项的回归系数的加权和。
权重很难描述,但易于获得。变量的主效应系数始终获得1的权重。对于涉及该变量的一项的其他系数,权重是该项中其他变量乘积的平均值。例如,如果我们有五个“原始”变量x1, x2, x3, x4, x5
,加上四个双向交互(x1,x2), (x1,x3), (x2,x3), (x4,x5)
,以及一个三个交互(x1,x2,x3)
,则模型为
y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 + b5*x5 +
b12*x1*x2 + b13*x1*x3 + b23*x2*x3 + b45*x4*x5 +
b123*x1*x2*x3 + e
总体的主要影响是
B1 = b1 + b12*M[x2] + b13*M[x3] + b123*M[x2*x3],
B2 = b2 + b12*M[x1] + b23*M[x3] + b123*M[x1*x3],
B3 = b3 + b13*M[x1] + b23*M[x2] + b123*M[x1*x2],
B4 = b4 + b45*M[x5],
B5 = b5 + b45*M[x4],
其中M [。]表示括号内数量的样本均值。括号内的所有乘积项都是为了进行回归而构造的,因此,回归程序应该已经了解它们,并且应该能够根据要求打印其均值。
在仅具有主要作用和双向交互作用的模型中,有一种更简单的方法来获得整体作用:将原始变量居中[1]。这应在计算乘积项之前完成,而不要对乘积进行。然后,所有M [。]表达式都将变为0,并且回归系数将被解释为总体效果。b的值将改变;B的值不会。仅需要将交互所涉及的变量居中,但将其他测量变量居中通常不会造成任何伤害。使变量居中的一般效果是,除了更改截距之外,它还仅更改与居中变量交互的其他变量的系数。特别是,它不会更改任何涉及中心变量的项的系数。在上面给出的示例中,居中x1将更改b0,b2,b3和b23。
[1-不同人使用“居中”的方式恰好足以引起混乱。如此处所用,“将变量以#为中心”表示从变量的所有分数中减去#,将原始分数转换为与#的偏差。]
那么,为什么不总是始终以手段为中心呢?三个原因。首先,无中心变量的主效应系数本身可能是令人感兴趣的。在这种情况下居于中心会适得其反,因为它会改变其他变量的主效应系数。
第二,居中将使所有M [。]表达式均为0,从而仅在没有三向或更高交互作用的模型中将简单效果转换为总体效果。如果模型包含此类交互,则即使所有变量均以其均值为中心,也必须执行b-> B计算。
第三,以诸如平均值之类的值为中心,该值是由预测变量的分布而不是合理选择的值所定义的,这意味着受中心影响的所有系数都将特定于您的特定样本。如果您以均值为中心,那么如果某人想要获得与您获得的系数相同的值,则尝试复制您的研究的人必须以您的均值而不是他们自己的均值为中心。解决该问题的方法是将每个变量的中心位置取决于变量的合理选择的中心值,该中心值取决于得分的含义,而不取决于得分的分布。但是,b-> B的计算仍然是必需的。
总体效果的显着性可以通过测试回归系数线性组合的常规方法进行测试。但是,必须谨慎解释结果,因为总体效果不是结构参数而是取决于设计。在预测变量分布的变化下,结构参数-回归系数(无中心或有中心的中心)和误差方差可能会保持不变,但是总体效果通常会发生变化。总体影响是特定于特定样本的,不应预期会延续到预测变量上具有不同分布的其他样本。如果一项研究的总体效果显着,而另一项研究没有,则可能仅反映了预测变量分布的差异。