考虑下面的R示例:
plot( hclust(dist(USArrests), "ave") )
y轴的“高度”到底是什么意思?
查看北卡罗来纳州和加利福尼亚州(位于左侧)。加利福尼亚在北卡罗来纳州比在亚利桑那州“更近”吗?我可以做出这种解释吗?
夏威夷(右)加入集群很晚。我可以看到它,因为它比其他州“更高”。通常,我如何正确解释树状图中标签“较高”或“较低”的事实?
标签的位置没有意义。如果您不了解y轴,那么很奇怪您会很好地理解层次聚类。
—
斯特凡·洛朗2014年
也请注意,层次聚类一般不会不给你分层(树)分类。平均方法(您使用的方法)尤其没有。在这里看到最后一点。
—
ttnphns 2014年
标签的位置虽然有一点意义。位置越高,对象与其他对象的链接就越晚,因此更像是离群值或离群值。
—
ttnphns 2014年
@StéphaneLaurent您说对了,听起来很矛盾。在那方面,我仍然认为我能够对我熟悉的数据树状图进行交织。此外,ttnphns和Peter Flom指出,标签的位置有一点意义。最后,您的评论对我没有建设性。
—
Ric 2014年
?hclust
。