欧氏距离得分和相似性


13

我刚读完《集体智慧》(托比·塞加兰(Toby Segaran))一书,就遇到了欧几里得距离得分。在书中作者展示了如何计算两个建议阵列之间的相似性(即person×moviescore)

他通过 d p 1p 2= 计算两个人p 2的欧几里得距离p1p2

d(p1,p2)=i  item(sp1sp2)2

这对我来说完全有意义。我真正不明白的是,为什么他最后计算以下内容以获得“基于距离的相似性”:

11+d(p1,p2)

因此,我不知何故必须是从远距离到相似的转换(对吗?)。但是为什么配方设计师看起来像这样?有人可以解释吗?


可以通过很多方法将相似点和相似点相互转换-具体公式取决于对您有意义的以及将来的分析。在那本教科书中,作者出于某种原因偏爱您显示的公式。处于其他情况的其他人可能会选择其他公式。最几何正确的方式转换成欧氏距离为相似度将从遵循余弦定理数据都为中心的情况下,并说明这里在参数。1.
ttnphns

好!但是,如果我理解正确,那么您实际上并不会真正将欧几里德距离转换为相似度,而只是使用一个不同的函数来返回0和1之内的值(因为余弦),对吗?我的意思是,与计算所有距离然后通过例如在最小和最大距离之间进行插值将它们转换为相似度相比,这似乎与我不同。对?
浏览

如果您有一个平方欧氏距离的平方对称矩阵,并且对其执行“双重居中”运算,那么您将获得标量积矩阵,当您将欧氏空间的原点放在配置的中心时将观察到对象。这些标量积角度类型的相似性。它们很像协方差。它们没有限制在0-1范围内,它们可以是负数,正数,对角线元素也不一定是1。不过,它们是相似的。
ttnphns

Answers:


12

反之则是从距离变为相似。

分母中的1表示使最大值为1(如果距离为0)。

平方根-我不确定。如果距离通常大于1,则根将使远距离变得不那么重要;反之,如果距离小于1,则距离越大越重要。


抱歉! 平方根错误。作者实际上将其放在第二个公式中,但在第一个公式中将其省略。所以它不应该在那里
导航

是的,但是将最大值设置为1的提示很有意义!谢谢!
导航


1

正如您提到的,您知道Euclidence距离的计算,因此我在解释第二个公式。

欧几里得公式计算距离,对于相近的人或物品,距离将更小。就像如果它们相同,则距离为0,而完全不同则大于0。

但是,我们需要一个给出较高值的函数,它们是相似的。可以通过在函数上加1(这样就不会除以零的误差)并将其取反来完成。就像距离0和相似度分数1/1 = 1


我不明白这个答案。
Michael R. Chernick '18年

好的,假设第1项和第2项之间的欧几里得距离为4,第1项和第3项之间的欧几里得距离为0(意味着它们100%相似)。这些是虚拟空间中物品的距离。距离值越小意味着它们彼此靠近意味着越相似。现在我们想要一个数值,如果数值非常相似,它可以给出更大的数字。这样我们就可以反距离值。但是,如果我们的距离为0,那为什么在分母中加1。因此,第1和第2项的相似性得分是1 /(1 + 4)= 0.2,第1项和第3项的相似性得分是1 /(1 + 0)= 0
user10009133

也许您在谈论某种距离度量,但欧几里得距离遵循关于向量空间的特定公式。
Michael R. Chernick

1/1+d(p1,p2)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.