除了从字面上测试模型(x1:x2
或x1*x2 ... xn-1 * xn
)中每个可能的变量组合之外。您如何确定您的独立(希望)变量之间是否应该存在交互作用?
尝试识别交互的最佳实践是什么?有没有可以使用或可以使用的图形技术?
除了从字面上测试模型(x1:x2
或x1*x2 ... xn-1 * xn
)中每个可能的变量组合之外。您如何确定您的独立(希望)变量之间是否应该存在交互作用?
尝试识别交互的最佳实践是什么?有没有可以使用或可以使用的图形技术?
Answers:
Cox和Wermuth(1996)或Cox(1984)讨论了一些检测相互作用的方法。问题通常是交互术语的通用性。基本上,我们(a)一次拟合(并测试)所有二阶交互项,并且(b)绘制其对应的p值(即,作为的函数的No.项)。然后,我们的想法是查看是否应保留一定数量的交互项:在所有交互项均为零的假设下,p值的分布应均匀(或等效地,散点图上的点应沿一条穿过原点的线)。
现在,正如@Gavin所说,适合许多(如果不是全部)交互可能会导致过度拟合,但是从某种意义上说,它也是无用的(某些高阶交互术语通常根本没有意义)。但是,这与解释有关,而不是与相互作用的检测有关,Cox已经在“相互作用的解释:回顾”中提供了很好的综述(《应用统计年鉴 2007,1(2),371-385)》-包括上面引用的参考。其他值得研究的研究领域是基因研究中的上位性作用研究,尤其是基于图形模型的方法(例如,一种用于识别基因关联网络中统计相互作用因子的有效方法)。
我的最佳实践是在拟合模型之前考虑要解决的问题。鉴于您正在研究的现象,什么是合理的模型?适合变量和交互的所有可能组合听起来像是对我的数据挖掘。
拟合树模型(即使用R)将帮助您识别解释变量之间的复杂相互作用。在此处阅读第30页的示例。