我刚读完《集体智慧》(托比·塞加兰(Toby Segaran))一书,就遇到了欧几里得距离得分。在书中作者展示了如何计算两个建议阵列之间的相似性(即。
他通过 d (p 1,p 2)= √计算两个人和p 2的欧几里得距离
这对我来说完全有意义。我真正不明白的是,为什么他最后计算以下内容以获得“基于距离的相似性”:
因此,我不知何故必须是从远距离到相似的转换(对吗?)。但是为什么配方设计师看起来像这样?有人可以解释吗?
可以通过很多方法将相似点和相似点相互转换-具体公式取决于对您有意义的以及将来的分析。在那本教科书中,作者出于某种原因偏爱您显示的公式。处于其他情况的其他人可能会选择其他公式。最几何正确的方式转换成欧氏距离为相似度将从遵循余弦定理数据都为中心的情况下,并说明这里在参数。1.
—
ttnphns
好!但是,如果我理解正确,那么您实际上并不会真正将欧几里德距离转换为相似度,而只是使用一个不同的函数来返回0和1之内的值(因为余弦),对吗?我的意思是,与计算所有距离然后通过例如在最小和最大距离之间进行插值将它们转换为相似度相比,这似乎与我不同。对?
—
浏览
如果您有一个平方欧氏距离的平方对称矩阵,并且对其执行“双重居中”运算,那么您将获得标量积矩阵,当您将欧氏空间的原点放在配置的中心时将观察到对象。这些标量积是角度类型的相似性。它们很像协方差。它们没有限制在0-1范围内,它们可以是负数,正数,对角线元素也不一定是1。不过,它们是相似的。
—
ttnphns