7
使用稀疏向量在非常高的维空间中找到紧密对
我有NNN(约一百万个)特征向量。有(〜一百万)个二元特征,但是在每个向量中,只有(〜一千)为,其余为。我正在寻找具有至少(〜一百)个共同特征(两个都为)的向量对。此类对的数量与(〜一百万)相似。K 1 0 L 1 NMMMKKK111000LLL111NNN 我认为这可以在非常高维的空间中寻找闭合点对来解决。距离函数可以基于两个向量共有多少个特征。但这对于更常规的距离度量(例如欧几里得)可能也很有用。 哪些知名算法对解决此问题有用?或二次方都是不切实际的。中号NNNMMM 问题的现实表达示例是考虑个人在多个位置之间移动。如果两个人同时在同一地点,我们说他们会面。(存在至少1个人的位置时间组合的数量为)我们正在寻找朋友:至少遇到次的人。M LNNNMMMLLL