在SVM算法中,为什么向量w与分离的超平面正交?


13

我是机器学习的初学者。在SVM中,分离的超平面定义为。为什么我们说向量与分离超平面正交?wy=wTx+bw


3
(对于神经网络)一个类似问题的答案在这里
bogatron 2015年

@bogatron-我完全同意你的看法。但是我的只是一个支持SVM的答案。
无题

2
除非不是。您的答案是正确的,但没有关于SVM的任何信息(也不应该有)。只是定义超平面的向量方程。wTx=b
bogatron 2015年

Answers:


10

在几何上,向量w正交于定义的线。这可以理解为:wTx=b

首先取。现在很明显,所有向量内积随消失都满足该方程,即,所有正交于w的向量都满足该方程。x wb=0xw

现在,通过向量a将超平面平移离开原点。现在,平面的等式变为:,即我们发现对于偏移,这是向量在向量上的投影。b = a T w(xa)Tw=0b=aTww ^aw

在不失一般性的前提下,我们可以选择垂直于该平面的垂直线,在这种情况下,长度表示最短的正交线原点和超平面之间的距离。||a||=|b|/||w||

因此,向量被称为与分离超平面正交。w


4

之所以是正常的超平面是因为我们定义它是这个样子:w

假设我们在3d空间中有一个(超)平面。令为该平面上的点,即P 0 = x 0y 0z 0。因此,从原点的矢量0 0 0 这一点仅仅是< X 0ÿ 0Ž 0 >。假设我们在平面上有一个任意点P x y z 。加入P的向量P0P0=x0,y0,z0(0,0,0)<x0,y0,z0>P(x,y,z)P然后由下式给出: PP 0 = < x x 0y y 0z z 0 > 请注意,该矢量位于平面内。P0

PP0=<xx0,yy0,zz0>

现在,让我们Ñ是正常的(正交的)矢量的平面。因此 ÑP - P 0= 0 因此 ÑP - ñP 0 = 0 注意,- ñP 0只是一个数字和等于b中我们的情况,而ñ只是W¯¯Pn^

n^(PP0)=0
n^Pn^P0=0
n^P0bn^wP。因此根据定义,w与超平面正交。xw

2

令决策边界定义为wTx+b=0。考虑点xaxb,它们位于决策边界上。这给了我们两个方程式:

wTxa+b=0wTxb+b=0

wT.(xaxb)=0xaxbxbxawT.(xaxb)wTxaxb


0

使用与超平面正交的向量的代数定义:

 x1,x2

wT(x1x2)=(wTx1+b)(wTx2+b)=00=0 .
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.