树状图聚类的词法相关


10

考虑树状图聚类的上下文。让我们称原始差异为个体之间的距离。构建完树状图后,我们将两个个体之间的同态差异定义为这些个体所属的簇之间的距离。

有人认为,原始差异和同类差异之间的相关性(称为“ 相关性相关性”)是分类的“适用性指标”。这听起来让我很困惑。我的反对意见不依赖于Pearson相关性的特定选择,而是基于这样的一般思想,即原始差异和同义差异之间的任何联系都可能与分类的适用性有关。

您是否同意我的观点,或者您是否可以提出一些论点来支持使用cophenetic相关性作为树状图分类的适用性指标?


您无需解释您对(相当直观)的异议general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification。分类应反映原始差异。树状图分类的基本特征是通过同位异质性。有没有。错误?
ttnphns

1
顺便说一句,不应将分层(聚集)聚类的概念与分层(树状)分类相混合。聚类产生其树状图作为过程报告;它并不声称它是分层分类结果
ttnphns

1
仅针对“教条式”分类提出了同义相关-在分类反映成对差异的情况下,(同义)相关的有用性概念已大为沿用。
ttnphns

2
您可能想阅读有关共形相关的这篇文章
ttnphns 2012年

3
@StéphaneLaurent对于您的问题,我无能为力,但我一直在阅读对话框。你说的什么都没冒犯我。您还说过,您不知道分类和聚类之间的区别,而且我还没有看到这个简单的问题得到回答。这是机器学习人员所说的监督学习和无监督学习之间的区别。在分类中,您知道数据的所有类别标签,并使用该信息为将来没有标签的情况构建分类规则。在群集中,您没有标签。
Michael R. Chernick

Answers:


2

...是分类的“适用性指标”

对我来说,这还不很清楚。我知道的方式是

原始差异与同位异同之间的相关性(称为同位相关)

是观测值之间的层次结构的度量,即它们之间的距离。也就是说,与不同聚类中的观测值的相异性最好是相似的。考虑到使用欧几里得距离和完全链接进行聚类的数据集A和B 在此处输入图片说明 ...即使不看待显着距离图或计算显着相关性,也可以看到A的显着相关性高于B.在一个层次结构中,有层次。因此,CC会告知与同一级别(集群)上的观测值的距离是否相似。

为了完整起见:交代相关为CC(A)= 0.936和CC(B)= 0.691


1
我希望我在这方面更熟练。我不太喜欢您的带有热图的示例。您看到什么使CC(A)> CC(B)显而易见?例如,如果上面的三角形是行距,下面的三角形是原始行距,并且两个三角形都显示相似的模式,那么我会认识到CC会很高,以此类推。 。难道仅仅是A会自然地带来更好的聚类和结果CC最终必须匹配得好吗?
gung-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.