我想对数据进行分层聚类,但我不想使用欧几里得距离,而是想使用相关性。此外,由于相关系数的范围从-1到1,用在我的研究都在-1和1表示“共同调控”,我治疗既-1和1为d = 0。因此,我的计算ð = 1 - | r |
我读了一个单独的问题(关于k均值聚类),您应该使用余弦定理将r转换为真正的欧几里得d:
将相关性转换为距离以进行层次聚类的最准确方法是什么?
3
是的,最后一个公式是可能的一种- 几何上正确的方法 -。但是你可能忽略的符号,如果它使你的感觉,使d 2 = 2 (1 - | - [R |)。在大多数情况下,您可以安全地丢弃2而不影响群集结果。距离可以视为平方欧几里德。在该线程中,讨论了距离转换后的相关度量是否为公制距离。
—
ttnphns
此外,你不具备总是转换成直线相异性,比如欧几里得距离。人们很少直接基于r或|进行聚类。r | 就像相似度一样;它是角度相似度
—
ttnphns