假设我们有一组元素E和两个元素ei,ej∈E之间的相似度函数(而不是距离)sim(ei,ej)。
我们如何使用sim(有效地)将E的元素聚类?
ķ -means,例如,需要在给定ķ,雨棚聚类需要两个阈值。如果我们不想要这样的预定义参数怎么办?
注意,sim不一定是度量(即三角形不等式可能成立,也可能不成立)。此外,簇是否不相交(E的分区)也没关系。
1-sim(ei, ej) = Distance
。使用距离度量,您可以应用例如分层聚类。从根开始,您将看到在什么级别的粒度群集上可以解决您的特定问题。