一种或另一种方式是,每种聚类算法都依赖于点的“接近度”概念。从直观上看,您可以使用相对(比例不变)概念或绝对(一致)接近性概念,但不能同时使用两者。
我将首先尝试通过一个例子来说明这一点,然后继续说这种直觉如何与克莱因伯格定理相吻合。
一个说明性的例子
假设我们有两套S1和S2的270点的每个,配置在这样的平面:
您可能在这两张图片中都看不到点,但这仅仅是因为许多点非常接近。放大时会看到更多点:270
您可能会自然而然地同意,在两个数据集中,这些点都以三个簇的形式排列。但是,事实证明,如果放大的三个群集中的任何一个,您将看到以下内容:S2
如果您相信绝对的接近性或一致性的概念,那么无论您在显微镜下看到的是什么,都仅由三个簇组成,这仍然会得到保持。实际上,S 1和S 2之间的唯一区别是,在每个群集中,某些点现在更靠近在一起。另一方面,如果您相信相对的相对性或尺度不变性,您会倾向于认为S 2不是由3而是由3 × 3 = 9个簇组成。这些观点都不是错误的,但是您必须选择一种方法或另一种方法。S2S1S2S233×3=9
等距不变性的一种情况
如果将上述直觉与克莱因伯格定理进行比较,您会发现它们略有出入。确实,克莱因伯格定理似乎说,只要您不关心称为丰富性的第三个属性,就可以同时实现尺度不变性和一致性。但是,如果您同时坚持规模不变性和一致性,那么丰富度并不是失去的唯一属性。您还会失去另一个更基本的属性:等距不变。这是我不愿牺牲的财产。由于它并未出现在Kleinberg的论文中,因此我将在此稍等一下。
简而言之,如果聚类算法的输出仅取决于点之间的距离,而不取决于某些附加信息(例如,附加到点的标签或施加在点上的顺序),则它是等距不变的。我希望这听起来非常温和自然。Kleinberg论文中讨论的所有算法都是等距不变的,除了具有簇停止条件的单连锁算法。根据Kleinberg的描述,此算法使用这些点的字典顺序,因此其输出实际上可能取决于您如何标记它们。例如,对于一组三个等距点,单联动算法的输出为2k2根据您将三个点标记为“猫”,“狗”,“鼠标”(c <d <m)还是“汤姆”,“尖峰”,“杰瑞”(J, <S <T):
当然容易这个不自然的行为可以通过更换被修复 -cluster与停止条件“ (≤ ķ ) -cluster停止条件”。这个想法只是不打破等距点之间的联系,并在我们最多到达k个簇时立即停止合并簇。修复后的算法在大多数情况下仍会产生k个簇,并且等距不变和比例不变。但是,与上述直觉相一致,它将不再是一致的。k(≤k) kk
对于等距不变性的精确定义,回想克莱因伯格限定聚类算法上的有限集合作为一个地图,分配给每个度量上小号的分区小号:
上两个度量和之间
的等距是排列,使得为所有点和在。 SSS我d d '小号我:小号→ 小号d '(我(X ),我(ÿ ))= d (X ,ÿ )X ÿ 小号
Γ:{metrics on S}→{partitions of S}d↦Γ(d)
idd′Si:S→Sd′(i(x),i(y))=d(x,y)xyS
定义:如果聚类算法满足以下条件,则它是等距不变的:对于任何度量和,以及它们之间的任何等距,点和都位于当且仅当原始点和位于的同一群集中时。 d d '我我(X )我(Ý )Γ(d ')X Ý Γ(d )Γdd′ii(x)i(y)Γ(d′)xyΓ(d)
当我们想到的聚类算法,我们经常识别抽象集合平面中的一个具体的点的集合,或在其他一些环境空间,想象不同的度量作为移动的点左右。确实,这是我们在上面的说明性示例中采取的观点。在这种情况下,等距不变性意味着我们的聚类算法对旋转,反射和平移不敏感。小号小号SSS
克莱因伯格定理的一个变体
上面给出的直觉是由Kleinberg定理的以下变体捕获的。
定理:不存在同时一致且尺度不变的非平凡等距不变聚类算法。
在这里,由琐碎的聚类算法,我指的是以下两种算法之一:
为的每个指标分配离散分区的算法,其中每个群集都由一个点组成,S
分配给上每个指标的总分区(由一个集群组成)的算法。S
声称这些愚蠢的算法是仅有的两个等距不变算法,它们都是一致且尺度不变的。
证明:
令为我们的算法应该在其上运行的有限集。令为上的度量,其中任意一对不同的点都具有单位距离(即对于所有,)。由于是等距不变的,因此只有两种可能性:要么是离散分区,要么是块分区。首先让我们看一下是离散分区的情况。给定任何指标上Γ d ₁小号d ₁(X ,ÿ )= 1 X ≠ ý 小号Γ Γ(d ₁)Γ(d ₁)Γ(d ₁)Γ(d ₁)d 小号≥ 1 d Γ(d )= Γ(d ₁)Γ Γ(d ₁)dSΓd₁Sd₁(x,y)=1x≠ySΓΓ(d₁)Γ(d₁)Γ(d₁)Γ(d₁)dS,我们可以重新缩放比例,以使所有成对的点在下的距离。然后,通过一致性,我们发现。因此,在这种情况下,是将离散分区分配给每个指标的简单算法。其次,让我们考虑是块分区的情况。我们可以对上的任何度量进行重新缩放,以使所有成对的点之间的距离,因此一致性又意味着。因此,在这种情况下也是微不足道的。∎≥1dΓ(d)=Γ(d₁)ΓΓ(d₁)d≤ 1 Γ(d )S≤1ΓΓ(d)=Γ(d₁)Γ
当然,这一证明与玛格丽塔·阿克曼(Margareta Ackerman)关于克莱因伯格原理的证明在精神上非常接近,亚历克斯·威廉姆斯(Alex Williams)的答案对此进行了讨论。