首先,让我首先回答您的问题。SVM不是概率模型。原因之一是它不对应于可归一化的可能性。例如,在正则最小二乘你有损失函数和正则‖ 瓦特‖ 2 2。通过最小化两者之和获得权重向量。然而,这相当于最大化的日志后 W¯¯给出的数据p (w ^ |(ÿ∑i∥yi−⟨w,xi⟩−b∥22∥w∥22w,你可以看到要的产物 w( Z上的高斯似然和高斯先验p(w|(y1,x1),...,(ym,xm))∝1/Zexp(−∥w∥22)∏iexp(∥yi−⟨w,xi⟩−b∥22)wZ确保它正常化)。通过翻转损失的符号并对其求幂,可以从损失函数获得高斯似然。但是,如果使用SVM的损失函数执行此操作,则对数似然率不是可归一化的概率模型。
有尝试将SVM变成一体。我认为,最值得注意的一个也是在libsvm中实现的:
约翰·普拉特(John Platt):支持向量机的概率输出以及与正则似然方法的比较(NIPS 1999):http : //www.cs.colorado.edu/~mozer/Teaching/syllabi/6622/papers/Platt1999.pdf
为了更具体地回答您的问题:SVM中的想法确实是,测试向量离超平面越远,它就属于某个类别(当然,当错误的一面时除外)。从这种意义上讲,支持向量不属于该类的可能性很高,因为它们要么是最靠近超平面的位置,要么是位于超平面错误侧的那些。从libsvm获得的值与决策函数中的α无关。这是相当的决定函数的输出Σ 我∈ 小号V α 我 ķ (X ,X 我)+ b(因此应适当地称为αα∑i∈SVαik(x,xi)+b)。由于 ÿ = Σ 我∈ 小号V α 我 ķ (X ,X 我)+ b = ⟨ 瓦特,φ (X )⟩ ħ + b其中瓦特生活在再生核Hilbert空间, ÿ正比于所涉及的符号距离超飞机。如果您的标准划分这将是 W ^,这在内核方面是 ‖ w ^ ‖ ^ h = √yy=∑i∈SVαik(x,xi)+b=⟨w,ϕ(x)⟩H+bwyw。∥w∥H=∑i,j∈SVαiαjk(xi,xj)−−−−−−−−−−−−−−−−−√