4
使用R进行尺寸缩减的t-SNE vs PCA有什么问题?
我有一个336x256浮点数的矩阵(336个细菌基因组(列)x 256个标准化四核苷酸频率(行),例如,每列总计1)。 使用主成分分析运行分析时,我得到很好的结果。首先,我根据数据计算kmeans聚类,然后运行PCA并基于2D和3D中的初始kmeans聚类为数据点着色: library(tsne) library(rgl) library(FactoMineR) library(vegan) # read input data mydata <-t(read.csv("freq.out", header = T, stringsAsFactors = F, sep = "\t", row.names = 1)) # Kmeans Cluster with 5 centers and iterations =10000 km <- kmeans(mydata,5,10000) # run principle component analysis pc<-prcomp(mydata) # plot dots plot(pc$x[,1], pc$x[,2],col=km$cluster,pch=16) # plot …