Answers:
这个问题被称为维数的诅咒。基本上,随着您增加维数,空间中的点通常趋向于远离所有其他点。这使得划分空间非常困难(例如对于分类或聚类而言是必需的)。
您可以轻松地自己看到这一点。我从1..1000的 20个均匀选择的d值中,在单元超立方体中生成了随机d维点。对于d的每个值,我计算了从第一个点到所有其他点的距离,并取这些距离的平均值。对此进行绘制,即使在每个维度中生成点的空间保持不变,我们也可以看到平均距离随维度而增加。
这不是一个完整的答案,但是您引用的Wikipedia页面指出:
如果存在嘈杂或不相关的特征,或者特征尺度与其重要性不符,则会严重降低k-NN算法的准确性。
在存在高维特征空间的情况下,发生这种情况的可能性增加。