我有一个输入参数为(聚类数)的聚类算法(不是k均值)。执行聚类后,我想对这种聚类的质量进行一些定量的衡量。聚类算法具有一个重要的特性。对于如果我将数据点之间没有任何明显区别地馈入该算法,结果我将得到一个包含数据点的群集和一个包含1个数据点的群集。显然这不是我想要的。因此,我想计算此质量度量以估计此聚类的合理性。理想情况下,我将能够比较不同k的度量。所以我将在k范围内运行聚类并选择质量最好的一种。我该如何计算这种质量指标?
更新:
这是是不良聚类的示例。假设在形成等边三角形的平面上有3个点。将这些点分为2个群集显然比将它们分为1个或3个群集要差。