在很多机器学习算法,特征缩放(又名可变缩放,标准化)是一种常见的prepocessing一步维基百科-特征缩放 -这个问题是接近问题#41704 -如何以及为什么做归一化和特征缩放工作?
关于决策树,我有两个问题:
- 是否有任何需要特征缩放的决策树实现?我的印象是,大多数算法的分割标准对规模无动于衷。
- 请考虑以下变量:(1)单位,(2)小时,(3)每小时-最好是将这三个变量按原样保留在决策树中,否则我们会遇到某种类型的冲突因为“标准化”变量(3)与(1)和(2)有关?也就是说,您是通过将所有三个变量都放入混合中来攻击这种情况,还是通常选择这三个变量的某种组合,或者只是使用“标准化/标准化”功能(3)?