现实世界中的数据有时具有自然数量的集群(尝试将其集群成小于某个魔术系数k的集群数量会大大增加集群成本)。今天,我参加了亚当·迈耶森(Adam Meyerson)博士的演讲,他将这类数据称为“可分离数据”。
除了K均值以外,还有哪些聚类形式化方法可以用来利用数据的自然可分离性的聚类算法(近似或启发式算法)?
现实世界中的数据有时具有自然数量的集群(尝试将其集群成小于某个魔术系数k的集群数量会大大增加集群成本)。今天,我参加了亚当·迈耶森(Adam Meyerson)博士的演讲,他将这类数据称为“可分离数据”。
除了K均值以外,还有哪些聚类形式化方法可以用来利用数据的自然可分离性的聚类算法(近似或启发式算法)?
Answers:
除了Ostrovsky等人的著作以及Arthur和Vassilvitskii的k均值行为外,还有大量关于欧几里得k均值和k均值的理论研究,导致了“线性”时间算法在这些公式。这些后期工作的有趣之处在于,它们将可分离性用作分析中的工具,但在数据中却不需要。