Answers:
回归模型中明确需要交互,因为该公式本身不包括任何交互。更准确地说,回归模型的输入将始终是线性的,而交互作用是的非线性组合。
最简单的方法是通过XOR问题,没有任何交互作用的回归模型无法解决此问题,因为它需要非线性组合。
另一方面,KNN和SVM(以及许多其他模型)都是通用函数逼近器。这意味着,它们不仅可以以线性方式组合其输入,而且还可以以任何可能的非线性方式组合其输入。只要有足够的层数或合适的内核,他们就可以根据需要完全“创建”自己的交互。但是,如果您知道或期望特定的交互非常重要,则仍然可以将它们用作输入,以指导模型朝着正确的方向发展。
类似地,基于树的模型可以解释为仅由交互组成。基本上,基于树的模型中的拆分会与所有先前的变量创建特定的交互。
因此,对于足以使用“高功率”模型(即通用函数逼近器)的模型,决定使用哪种交互,您不需要它们,可以让模型发挥自己的魔力。对于其他型号,取决于。有一些可用于指导决策的技术,例如CHAID或逐步回归。CHAID还具有大量功能,对于逐步回归,它可能会因为可能的交互作用而丢失。假设您具有要素,则存在可能的交互作用(不仅计算双向交互,还计算更高阶的交互作用)。