聚类分析,然后进行判别分析


10

我在文献中不时看到的(主要是关于精神障碍的临床分型),如果对基于k均值的聚类算法的结果使用判别分析(DA),有什么理由(如果有)?

通常不建议测试在聚类构建过程中使用的变量的组差异,因为它们支持类间(分别为类内)惯性的最大化(最小化)。因此,除非我们设法将个体嵌入较小维度的阶乘空间中,并获得这种划分的“一般化”的想法,否则我不确定是否会完全理解预测DA的附加值。但是即使在这种情况下,聚类分析从根本上仍然是一种探索性工具,因此乍一看,使用以这种方式计算的类成员资格来进一步得出评分规则似乎很奇怪。

对相关论文有什么建议,想法或指示吗?


下面是使用说明和示例Rcran.r-project.org/web/packages/adegenet/vignettes/...

Answers:


5

我对此一无所知。我出于描述目的使用了这种方法。DFA提供了一种很好的方式来汇总相对于原始变量的组差异和维数。一个人可能更容易地将组描述为原始变量,但是,这失去了聚类问题的固有多变量性质。使用DFA,您可以描述组,同时保持问题的多元特征不变。因此,它可以帮助解释群集,这是一个目标。当聚类方法和分类方法(例如DFA和Ward方法)之间存在密切关系时,这尤其理想。

您对测试问题是正确的。我发表了一篇使用DFA进行聚类分析的论文,以描述聚类解决方案。我介绍了DFA结果,没有测试统计信息。审稿人对此表示怀疑。我承认并把测试统计信息和p值放在了其中,并声明不应该以传统方式解释这些p值。


聚类后​​DA的程序步骤是什么?您能想到其他技术来找出哪些原始变量使某些聚类与其他聚类有所不同吗?
danas.zuokas,2012年

想要分享对那篇论文的引用吗,布雷特?
RomanLuštrik2012年

魏斯曼和马吉尔。2008年。“开发学生类型以检查第一年研讨会的有效性”,《第一年经验与转型中的学生》杂志20(2)。如果您需要纸质版,请离线与我联系。
Brett
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.