在回归中,交互作用项消除了两个相关的直接影响。我是否放弃互动或报告结果?相互作用不是原始假设的一部分。
在回归中,交互作用项消除了两个相关的直接影响。我是否放弃互动或报告结果?相互作用不是原始假设的一部分。
Answers:
我认为这很棘手。正如您所暗示的那样,这里存在着“道德风险”:如果您根本没有看过这种交互,那么您将变得自由而清晰,但是现在您有了丢弃数据的怀疑。
当您从仅主要效果转到交互模型时,关键可能是效果含义的改变。“主要效果”的获得很大程度上取决于治疗方法和对比的编码方式。在R中,默认设置是将与第一个因子水平(以字母顺序排列的名字顺序,除非您已竭尽全力地对它们进行不同编码)相反的处理作为基线水平。
说(为简单起见),对于每个因素,您有两个层次,即“控制”和“ trt”。如果不进行交互,则“ v1.trt”参数的含义(假设处理方式与R中的默认设置相反)是“ v1.control”和“ v1.trt”组之间的平均差”。“ v2.trt”参数的含义是““ v2.control”和“ v2.trt”之间的平均差”。
通过互动,“ v1.trt”是“ v2.control”组中“ v1.control”和“ v1.trt”之间的平均差异,类似地,“ v2.trt”是v2.control中的v2组之间的平均差异“ v1.control”组。因此,如果您在每个对照组中的治疗效果都比较小,但在治疗组中的效果很大,那么您很容易看到自己所看到的。
但是,在没有明显的交互作用项的情况下,我看到这种情况的唯一方法是,如果所有影响都相当微弱(因此,“影响消失”的真正含义是您从p = 0.06变为p = 0.04,跨魔术意义线)。
另一种可能性是您“消耗了太多的自由度”-也就是说,参数估计值实际上并没有改变太大,但是残留误差项由于必须估计另外4个[=(2- 1)*(5-1)]参数,使您的重要术语变得不重要。再说一次,我只希望数据集较小/影响相对较小。
一种可能的解决方案是对对比度进行总结,尽管这也很微妙-您必须确信“平均效果”对您的情况有意义。最好的事情是绘制数据并查看系数,并根据估计的参数了解正在发生的情况。
希望能有所帮助。
这可以改写
也就是说,如果您以以下形式重新表达变量
那么该模型是线性的,并且可能具有同余残差:
该分析表明,即使在某些应用程序中,也有可能建立一个模型,其中唯一的影响似乎是相互作用。当变量(独立变量,相关变量或两者均以不合适的形式)呈现给您并且其对数是建模的更有效目标时,就会出现这种情况。变量和初始残差的分布提供了确定是否可能需要的线索:变量的偏斜分布和残差的异方差(具体来说,方差与预测值大致成正比)是指标。
这可能是解释上的问题,是对所谓的“直接效应”系数实际上是什么的误解。
在具有连续预测变量且没有交互项的回归模型中-也就是说,没有将项构造为其他项的乘积-每个变量的系数都是回归表面在该变量方向上的斜率。无论变量的值如何,它都是常数,并且显然可以衡量该变量的效果。
在具有交互作用的模型(即,使用构造为其他术语的乘积的术语)的情况下,无需进一步限定,就可以对不涉及任何交互作用的变量进行解释。当与所讨论的变量进行交互的所有变量的值均为零时,交互作用所涉及的变量的系数为回归表面在该变量方向上的斜率,并且该系数的显着性检验指的是回归曲面的斜率仅在预测变量空间的该区域中。由于不需要在该空间的该区域中实际存在数据,因此表观直接效应系数可能与实际观测到数据的预测器空间的区域中的回归表面的斜率几乎没有相似之处。在这种情况下,没有真正的“直接影响”;最好的替代方法可能是“平均效应”:在每个数据点上取并在所有数据点上取平均值的回归曲面在相关变量方向上的斜率。有关此内容的更多信息,请参见为什么以居中变量为中心会适度更改主要影响?