最近,我了解到,为机器学习问题找到更好解决方案的方法之一是创建功能。例如,可以通过汇总两个功能来做到这一点。
例如,我们拥有某种英雄的“攻击”和“防御”两个特征。然后,我们创建一个称为“总计”的附加功能,这是“攻击”和“防御”的总和。现在让我感到奇怪的是,即使是强硬的“攻击”和“防御”也几乎与“总数”紧密相关,我们仍然可以获得有用的信息。
这背后的数学是什么?还是我推理错了?
另外,对于像kNN这样的分类器来说,“总数”总是大于“攻击”或“防御”,这不是问题吗?因此,即使经过标准化处理,我们仍将具有包含不同范围值的特征?