我有一个包含数千个点的数据集,并且可以测量任意两个点之间的距离,但是数据点没有维数。我想要一种算法来在此数据集中找到聚类中心。我认为由于数据没有维度,因此群集中心可能由多个数据点和一个容差组成,并且群集中的成员资格可能由数据点到群集中心中每个数据点的距离的平均值来确定。
如果这个问题有一个众所周知的解决方案,请原谅我,我对这种问题知之甚少!我的研究(非常有限)仅提出了维度数据的聚类算法,但是如果我遗漏了一些明显的内容,我会提前道歉。
谢谢!
为什么无量纲会使这个问题变得特别?
—
拉斐尔
我看到的一些用于聚类的算法(实际上只是k均值)需要生成随机数据点作为种子,这对于无量纲数据是不可能的。因此,特殊的要求是聚类中心必须由一组现有的数据点(可能是加权的)表示。
—
paintcan 2010年