3
k-均值聚类分析后方差分析的适当性
经过K均值分析后,方差分析表后面的通知表明,不应将显着性水平视为相等均值的检验,因为已基于欧几里得距离得出了最大距离的聚类解。我应该使用哪种测试来显示聚类变量的均值在聚类之间是否不同?我已经在k均值输出提供的ANOVA表中看到了此警告,但是在某些参考资料中,我看到正在运行事后ANOVA测试。我是否应该忽略k均值ANOVA输出,并使用事后测试运行单向ANOVA并以传统方式解释它们?还是我只能暗示F值的大小,哪些变量对差异的贡献更大?另一个困惑是,聚类变量不是违反ANOVA的假设而呈正态分布,那么我可以使用Kruskal-Wallis非参数检验,但是它具有关于相同分布的假设。特定变量的集群间分布似乎并不相同,有些正偏,有些则负...我有1275个大样本,5个聚类,10个以PCA分数衡量的聚类变量。