我正在调查使用统计显着性检验(SST)来验证聚类分析的结果。我发现了有关该主题的几篇论文,例如
- “ 对于高维,低样本量数据聚类的统计显着性科幻通过” 刘,玉峰等人。(2008年)
- Bock(1985)的 “ 关于聚类分析中的一些显着性检验 ”
但是我有兴趣找到一些争论说SST 不适合验证聚类分析结果的文献。我发现声称它的唯一来源是软件供应商的网页
澄清:
我对测试是否因聚类分析而发现了重要的聚类结构感兴趣,因此,我想了解支持或驳斥“关于事后测试探索性数据结果的可能性”的论文。用来寻找聚类的分析”。
我刚刚发现了Milligan和Hirtle于2003年发表的一篇论文《聚类和分类方法》,该论文说,例如,使用ANOVA将是无效的分析,因为数据没有对组进行随机分配。
这是一个很好的问题,但可能值得指出的是,它的措辞看起来似乎存在二分法:要么可以测试聚类的重要性,要么不能。但是,情况有所不同,因为“集群分析”意味着各种各样的事情。在参考的论文中,重点是测试是否存在聚类的证据。在软件手册中,正确地表达了对用于发现聚类的探索性数据分析结果进行事后测试的可能性的担忧。这里没有矛盾。
—
ub
谢谢回答。您对我提出问题的方式是正确的。我对测试是否因聚类分析而发现了重要的聚类结构感兴趣,因此,我想了解支持或驳斥有关“对事后数据进行事后测试的可能性的担忧”的论文用来寻找聚类的分析”。我刚刚发现Milligan和Hirtle于2003年发表的一篇论文《聚类和分类方法》说,例如,使用ANOVA将是无效的分析,因为数据没有对组进行随机分配。
—
DPS