在1999年,Beyer等人。问, “最近的邻居”何时有意义?
自1999年以来,是否有更好的方法来分析和可视化距离平坦度对NN搜索的影响?
[给定的]数据集是否可以为1-NN问题提供有意义的答案?10-NN问题?100-NN问题?
您的专家今天将如何处理这个问题?
1月24日星期一编辑:
“距离变白”作为“随着尺寸增加的距离平坦度”的简称呢?
观察“距离泛白”的一种简单方法是运行2-NN,并绘制到最近邻居和第二近邻的距离。下图显示 了蒙特卡洛(Monte Carlo)对于一系列ncluster和尺寸的dist 1和dist 2。此示例显示了缩放的绝对差| dist 2 -dist 1 |的相当好的距离对比度。(相对差| dist 2 / dist 1 |→1作为维数→∞,因此变得毫无用处。)
在给定的上下文中应该使用绝对误差还是相对误差,当然取决于存在的“真实”噪声:困难。
建议:总是运行2-NN;2个邻居在靠近时很有用,在不靠近时有用。