考虑树状图聚类的上下文。让我们称原始差异为个体之间的距离。构建完树状图后,我们将两个个体之间的同态差异定义为这些个体所属的簇之间的距离。
有人认为,原始差异和同类差异之间的相关性(称为“ 相关性相关性”)是分类的“适用性指标”。这听起来让我很困惑。我的反对意见不依赖于Pearson相关性的特定选择,而是基于这样的一般思想,即原始差异和同义差异之间的任何联系都可能与分类的适用性有关。
您是否同意我的观点,或者您是否可以提出一些论点来支持使用cophenetic相关性作为树状图分类的适用性指标?
顺便说一句,不应将分层(聚集)聚类的概念与分层(树状)分类相混合。聚类产生其树状图作为过程报告;它并不声称它是分层分类结果。
—
ttnphns
仅针对“教条式”分类提出了同义相关-在分类应反映成对差异的情况下,(同义)相关的有用性概念已大为沿用。
—
ttnphns
您可能想阅读有关共形相关的这篇文章
—
ttnphns 2012年
@StéphaneLaurent对于您的问题,我无能为力,但我一直在阅读对话框。你说的什么都没冒犯我。您还说过,您不知道分类和聚类之间的区别,而且我还没有看到这个简单的问题得到回答。这是机器学习人员所说的监督学习和无监督学习之间的区别。在分类中,您知道数据的所有类别标签,并使用该信息为将来没有标签的情况构建分类规则。在群集中,您没有标签。
—
Michael R. Chernick
general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification
。分类应反映原始差异。树状图分类的基本特征是通过同位异质性。有没有。错误?