我在N维空间中有一组数据点。此外,在相同的N维空间中,我也有一个质心。有什么方法可以让我将这些数据点投影到二维空间中,同时将它们的相对距离信息保留在原始空间中。PCA是正确的吗?
我在N维空间中有一组数据点。此外,在相同的N维空间中,我也有一个质心。有什么方法可以让我将这些数据点投影到二维空间中,同时将它们的相对距离信息保留在原始空间中。PCA是正确的吗?
Answers:
正如前面的答案中提到的,有很多降维方法,要考虑的重要一件事是您要表示什么-您是否对欧几里得距离度量感兴趣?还是样本间的相似性度量?
对于前者,PCA是合适的。它通常用于连续测量,例如测量样品(动物,植物等)。不过,我也会研究较早答案中更现代的提及。
对于后者,您可能要尝试使用非欧几里德距离度量标准来比较相似性,因此存在一些好的方法,例如主成分排序(PCoA)和非度量多维标度(NMDS)。当您比较不同地区的生态群落时,就会发现一个可能使用这些生物的例子。因此,您的数据就是“计数”数据。有许多相似性指标,例如Jaccard,Sorensen,Bray-Curtis,可以有效地估计您的站点在其生物组成方面的相似程度。PCoA和NMDS基本上使您可以绘制样本(位置)以表示生态距离(相似性),并且在每个轴上都有一个位置得分。
有很多好的书籍和其他资源可用于多变量分析。在Google上搜索“整理”。此外,还有一个名为“ vegan”的R包,对于实际执行大量这项工作非常有用。
您的问题听起来像是用于多维缩放的教科书应用程序。在这里可以找到很好的介绍:http : //www.mathpsyc.uni-bonn.de/doc/delbeke/delbeke.htm
当然,您可以尝试PCA。但是PCA无意将相对距离信息保留在原始空间中。