非对称距离测度的聚类


9

如何将要素与非对称距离度量聚类?

例如,假设您要以星期几为特征对数据集进行聚类-从星期一到星期五的距离与从星期五到星期一的距离是不同的。

您如何将其纳入聚类算法的距离度量中?

Answers:


3

如果由于未来与过去不同而导致MF距离不对称,则需要真正的不对称聚类。首先,必须定义一个非对称距离函数。

给定距离函数,一种用于非对称聚类的方法是将原始数据嵌入到新的坐标空间中。参见Naohito Chino和Kenichi Shiraiwa撰写的“不对称MDS的某些非距离模型的几何结构”,Behaviormetrika,1992年(pdf)。这称为HCM(厄米经典模型)。

找出一个Hermitian矩阵,其中 找到特征值和特征向量,然后通过其相应特征值的平方根缩放每个特征向量。H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

这会将数据转换为复数空间。嵌入数据后,对象x和y之间的距离仅为x * y,其中*是共轭转置。此时,您可以对复数向量进行k均值运算。

光谱非对称聚类也已经完成,请参见Stefan Emilov Atev的论文,“在轨迹的光谱聚类中使用不对称性”,明尼苏达大学,2011年,给出了特殊算法的MATLAB代码。


1

您可以采用某种平均值(例如算术平均值,或者对于概率分布而言,是詹森-香农散度的平方根。)


1

您应该查看循环统计信息(如果您想在一周之内“工作”)


1

如果您的距离函数不是有效的Mercer内核,则 XXT,在哪里 X是克矩阵。在这种情况下,需要共同集群,也称为双向集群。此类算法同时为行和列生成聚类指示符。

您给出的示例是错误选择距离度量的结果。更好的距离度量是|days apart|

通常,距离函数应该是有效的Mercer内核。有效的Mercer核是具有两个观测值的任何函数,这些观测值是连续的,对称的并且具有正定协方差矩阵xD

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.