Answers:
对于k-NN,我建议将到之间的数据标准化。1
k-NN使用欧几里得距离作为比较示例的手段。计算两点之间的距离和 ,其中f_1 ^ i是x_1的第i个特征的值:X 2 = (˚F 1 2,˚F 2 2,。。。,˚F 中号2)˚F 我1我X 1
为了使所有特征在计算距离时都具有同等的重要性,这些特征必须具有相同的值范围。这只能通过归一化来实现。
如果未对它们进行归一化,则特征在)中具有值的范围,而在具有值的范围。在计算距离时,第二项的重要性要比第一项高倍,从而导致k-NN更加依赖第二项特征。规范化可确保将所有要素映射到相同的值范围。
另一方面,标准化确实具有许多有用的属性,但是不能确保将要素映射到相同的范围。尽管标准化可能最适合其他分类器,但k-NN或任何其他基于距离的分类器却并非如此。