Answers:
据我所知,一个聚类的“平均值”和单个聚类的质心是同一件事,尽管在处理多变量数据时,术语“质心”可能比“平均值”更为精确。
为了找到质心,每个维分别计算点位置的(算术)平均值。例如,如果您有以下几点:
那么质心将位于(((-1 + 0 + 1)/ 3,(10 + 5 + 20)/ 3,(3 + 2 + 10)/ 3),简化了(0,11 2/3, 5)。(注:质心不必是-很少是-原始数据点之一)
根据质心的物理解释,质心有时也称为质心或重心(它是由点定义的对象的质心)。像均值一样,质心的位置将与其他点的平方和距离最小化。
一个相关的想法是medoid,它是与所有其他数据点“最不相似”的数据点。与质心不同,质心必须是原始点之一。您可能还对与中位数相似的几何中位数感兴趣,但对于多元数据。这些都不同于质心。
但是,正如Gabe在他的回答中指出的那样,在比较聚类时,“质心距离”和“平均距离”之间存在差异。簇和之间的质心距离就是和之间的距离。的平均距离是由寻找每个集群中的点之间的平均成对距离来计算。换句话说,对于群集每个点,您计算,,... 并将它们平均在一起。
上面的答案可能不正确,请参见以下视频:https : //www.youtube.com/watch?v= VMyXc3SiEqs看来,平均值求和了群集1和群集2元素之间距离的所有组合-即n ^将2个距离相加,然后除以n ^ 2的平均值。
质心法首先计算其内部每个群集的平均值。然后,它计算这些平均点之间的一个距离。