k-均值算法中的循环


9

根据Wiki,最广泛使用的收敛标准是“辅助功能没有改变”。我想知道如果使用这样的收敛准则是否会发生循环?如果有人指出了一篇提供自行车运动示例或证明这是不可能的文章,我将感到高兴。


2
让我强调一下(因为经常被忽略),收敛证明需要(平方)欧几里德距离,以便距离函数和均值函数优化同一准则。如果您使用其他距离(实际上,您不应使用距离,而应使用“最小平方和”),则可能会失去k均值的收敛性。
已退出–Anony-Mousse 2013年

Answers:


7

本文似乎证明了收敛的有限步骤。


1
正是我想要的!
Tomek Tarczynski 2011年

4

所述 -means目标函数分配的每个变化,这意味着自动收敛而不循环严格减小。而且,在步骤的每个步骤中产生的分隔满足“ Voronoi性质”,因为每个点总是被分配到其最近的中心。这意味着可能分区总数的上限,这对于均值的终止时间产生了有限的上限。kkk


谢谢,直观地知道目标函数会减少,但我不确定它是否会严格减少。我想确保没有像线性编程
那样的类型学问题

是的,不是。当收敛时,它会花费指数时间,就像单纯形一样。此外,对于这两个问题,您都可以证明“平滑的”变体在多项式时间内收敛
Suresh Venkatasubramanian

2

有限的精度,可能会出现循环。

单精度经常骑自行车,而双精度例外。

当接近局部最小值时,由于四舍五入误差,目标函数有时可能会略有增加。当算法功能再次降低并最终达到局部最小值时,这通常是无害的。但有时,该算法会执行先前访问过的分配,然后开始循环。

在现实世界中的停止标准实现中,监视周期非常容易且安全。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.