美世定理是否相反?


11

一位同事有一个功能s,对我们来说,它是一个黑匣子。该函数测量两个对象的相似度s(a,b)

我们肯定知道s具有以下属性:

  1. 相似性分数是介于0和1之间(含0和1)的实数。
  2. 只有自我相同的对象的分数才为1。因此s(a,b)=1意味着a=b,反之亦然。
  3. 我们保证s(a,b)=s(b,a)

现在,他想使用需要距离作为输入的算法,并依赖于满足距离公理的输入。

我的想法是,我们可以将相似性分数视为RBF核的结果有一定距离(可以是欧几里得范数或其他距离),即可以用代数重新排列,并假设相似性分数指的是RBF内核用于某些(未知)坐标系中的一对点。

s(xi,xj)=exp(d(mi,mj)2r)rlogs(xi,xj)=d(mi,mj)

其中是一些未知向量,和X α是感兴趣的对象,并且d是一段距离。mαRnxαd

就尊重距离公理而言,显而易见的特性是可行的。结果必须为非负数,并且相同对象的距离仅为0。但是,这种相当普遍的情况不足以暗示三角不等式得到了尊重,这一点并不明显。

另一方面,这听起来有点疯狂。

所以我的问题是“在给定s的这些特性的情况下,是否存在使f s a b b = d a b 等于d的某个距离度量,那f是什么?”ff(s(a,b))=d(a,b)dsf

如果没有在这些一般情况下存在小号,有另外一组针对需求˚F存在?fsf


3
请注意,即使您获得了满足距离公理的成对距离集合,也无法保证存在具有实现这些距离的点的欧几里得空间。这样的嵌入并非总是可能的。参见例如math.stackexchange.com/questions/1000006d(a,b)
变形虫说恢复莫妮卡

这是一个非常有趣的线程!谢谢你的分享。我无意将自己限制在特定的距离。(因为朝相反的方向移动,所以可能会使用非欧氏距离的RBF内核。)
Sycorax说,莫妮卡(Reonica)

因此,您的问题仅在于如何将转换为d a b = f s a b ,以使d满足三角形不等式?此距离矩阵是否可嵌入到欧几里德空间中,对您而言并不重要。正确?我的直觉是,对于任意s来说这是不可能的。s(a,b)d(a,b)=f(s(a,b))ds
变形虫说恢复莫妮卡

这是对的。我怀疑这是不可能的,至少对没有附加限制。s
Sycorax说恢复莫妮卡

总是导致离散量度(en.wikipedia.org/wiki/Discrete_space),但这可能不是故意的,因此应添加一些条件(?)f:f(x)=Ix>0
Juho Kokkala

Answers:


6

美世定理是否相反?

并非在所有情况下都如此。

维基百科:“在数学,具体功能分析,Mercer的定理是一个表示一个的对称正定函数上的正方形的产品函数序列收敛的总和这个定理,在(默瑟1909),介绍的是中的一个。这是James Mercer工作的最显着成果,它是积分方程理论中的重要理论工具;用于随机过程的希尔伯特空间理论,例如Karhunen-Loève定理;它也用于表征对称正半定核。

这是希尔伯特空间上的“ 多对一映射 ” 。-一个过分简单化将其描述为一个散列或校验,你可以测试对一个文件,以确定身份或没有。

更多技术说明:分解定理

“在数学中,崩解定理是测度理论和概率理论的结果。它严格地定义了将测度非平凡的“限制”到所考虑的测度空间的测度零子集的概念。在某种意义上,“崩解”是与产品测度的构建相反的过程。”

另请参见:Nathan Srebro撰写的“ Fubini-Tonelli定理 ”,“ 铰链损失 ”,“ 损失函数 ”和“ 当用作相似性度量时内核有多好? ”,摘要:

摘要。最近,Balcan和Blum提出了一种基于一般相似性函数的学习理论,而不是正半定核。我们研究了基于核学习的学习保证与可以通过使用基于学习的学习保证之间的差距。内核作为相似性函数,由Balcan和Blum保留。我们对内核函数作为相似性函数使用时的性能提供了显着改进的边界,并将结果扩展到更实际相关的铰链损失然后显示零错误率。此外,我们证明了这个边界是紧密的,因此可以确定,传统的基于核的边距概念和较新的基于相似度的概念之间实际上存在着差距。”

一位同事有一个功能,对我们来说,它是一个黑匣子。s

请参阅:内核和相似性(R中)

这是一个黑匣子,因此您不确定是否使用哪个内核(如果它是基于内核的),并且一旦知道内核是哪个,就不会知道内核实现的详细信息。请参阅:kernlab中的rbfKernel方程是否不同于标准方程式?

另一方面,这听起来有点疯狂。

在有限的情况下,它是快速而有效的。就像锤子一样,如果您随身携带锤子,人们会称您为疯子吗?

内核方法之所以得名,是因为使用了内核函数,这使它们能够在高维,隐式特征空间中进行操作,而无需计算该空间中数据的坐标,而只需简单地计算图像之间的内积即可。在特征空间中的所有数据对中,此操作在计算上通常比显式的坐标计算便宜。这种方法称为“内核技巧”,已为序列数据,图形,文本,图像引入了内核函数,例如以及向量。

教训:您(有时)得到您所支付的费用。

所以我的问题是“在给定s的这些属性的情况下,是否存在使f s a b b = d a b 等于d的某个距离度量,那f是什么?”ff(s(a,b))=d(a,b)dsf

许多内容,请参见上面的链接,“ 流行的内核函数 ”,RBF,以及以下一个(昂贵的)示例:“ 时间序列傅立叶变换之间相似度的似然比距离度量 ”(2005年),作者Janacek,Bagnall和Powell。

如果没有在这些一般情况下存在小号,有另外一组针对需求˚F存在?fsf

不同的空间和方法可以更好地针对特定问题进行目标比较(和分解),仅希尔伯特空间很多方法

是的,列表很大,请参见上面的链接和(例如):复制内核Hilbert空间


-1

但是,这种相当普遍的情况不足以暗示三角不等式得到了尊重,这一点并不明显。

实际上,这还不够。让我们使用。如果存在三个点x y zd x y = 1d(a,b)=1s(a,b)x,y,zdyz=1d(x,y)=13,且dxz=1,则三角形不等式失败,因为dxz>dxy+dyzd(y,z)=13d(x,z)=1d(x,z)>d(x,y)+d(y,z)


1
我不知道这怎么证明。
变形虫说恢复莫妮卡

d

2
f(α)=1α

1
sfdfmsdf

1
m1s(a,b)xαmαs
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.