在k均值聚类中,总ss和ss之间意味着什么?


10

我是集群分析的新手。我正在使用R进行k均值聚类,我不知道这些是什么。如果它们的比率较小或较大,那会更好呢?

Answers:


12

基本上,这是对k均值已找到分类的良好程度的度量。SS显然代表平方和,因此这是“ Between”和“ Within”之间偏差的常见分解。理想情况下,您想要一个具有内部凝聚力和外部分离特性的聚类,即BSS / TSS比应接近1。

例如,在R中:

data(iris)
km <- kmeans(iris[,1:4], 3)

给出的BSS / TSS比率为88.4%(0.884),表明它非常适合。您应该格外小心,将WSS与集群数相对应通常是一个好主意,因为必须事先指定此数字。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.