Answers:
如果由于未来与过去不同而导致MF距离不对称,则需要真正的不对称聚类。首先,必须定义一个非对称距离函数。
给定距离函数,一种用于非对称聚类的方法是将原始数据嵌入到新的坐标空间中。参见Naohito Chino和Kenichi Shiraiwa撰写的“不对称MDS的某些非距离模型的几何结构”,Behaviormetrika,1992年(pdf)。这称为HCM(厄米经典模型)。
找出一个Hermitian矩阵,其中 找到特征值和特征向量,然后通过其相应特征值的平方根缩放每个特征向量。
这会将数据转换为复数空间。嵌入数据后,对象x和y之间的距离仅为x * y,其中*是共轭转置。此时,您可以对复数向量进行k均值运算。
光谱非对称聚类也已经完成,请参见Stefan Emilov Atev的论文,“在轨迹的光谱聚类中使用不对称性”,明尼苏达大学,2011年,给出了特殊算法的MATLAB代码。
如果您的距离函数不是有效的Mercer内核,则 ,在哪里 是克矩阵。在这种情况下,需要共同集群,也称为双向集群。此类算法同时为行和列生成聚类指示符。
您给出的示例是错误选择距离度量的结果。更好的距离度量是
通常,距离函数应该是有效的Mercer内核。有效的Mercer核是具有两个观测值的任何函数,这些观测值是连续的,对称的并且具有正定协方差矩阵。