多类感知器如何工作?


13

我没有数学背景,但是我了解简单的Perceptron的工作原理,并且我认为我掌握了超平面的概念(我想像它是3D空间中的一个平面,它将两个点云分开,就像一条线分开一样2D空间中的两个点云)。

但是我不明白一架飞机或一条直线如何分别在3D空间或2D空间中分隔三个不同的点云–从几何上讲这是不可能的,是吗?

我试图理解Wikipedia文章中的相应部分,但是在句子“这里,输入x和输出y是从任意集合中提取”时,已经惨遭失败。有人可以向我解释多类感知器,以及它与超平面的想法如何结合,还是可以向我指出一个不太数学的解释?

Answers:


8

假设我们有数据,其中是输入向量,是输入向量分类。X [R Ñ ÿ { 红,蓝,绿}(x1,y1),,(xk,yk)xiRnyi{red, blue, green}

我们知道如何为二进制结果建立分类器,因此我们进行了三遍:将结果分组在一起,,和。{ 蓝色,红色或绿色} { 绿色,蓝色或红色}{red, blue or green}{blue, red or green}{green, blue or red}

每个模型采用函数的形式,分别将其。这将输入向量带到与每个模型相关联的超平面的有符号距离,其中正距离对应于为蓝色,红色,绿色的。基本上,越大,模型就越认为是绿色,反之亦然。我们不需要输出是概率,我们只需要能够测量模型的置信度即可。f Rf Bf G f B f R f G f Gx xf:RnRfR,fB,fGfBfRfGfG(x)x

给定输入,我们根据,因此,如果在我们将为预测绿色。argmax c f cx f Gx { f Gx f Bx f Rx } xxargmaxc fc(x)fG(x){fG(x),fB(x),fR(x)}x

这种策略称为“一个对所有”,您可以在此处阅读。


3

我完全无法理解该Wiki文章。这是解释它的另一种方法。

具有一个逻辑输出节点的感知器是用于2类的分类网络。它输出,即处于其中一个类别中的概率,而处于另一类中的概率仅是。1 pp1p

具有两个输出节点的感知器是3类的分类网络。两个节点均输出处于类的概率,而处于第三类的概率为。 1 - Σ = 1 2 p pi1i=(1,2)pi

等等; 具有输出节点的感知器是类的分类器。实际上,如果没有隐藏层,则这种感知器与多项式逻辑回归模型基本相同,就像简单的感知器与逻辑回归一样。m + 1mm+1


您确定输出是实际概率吗?无论如何,我不知道多项式逻辑回归的工作原理,因此我将不得不对此进行研究。但是,没有一种(算法)方法来解释如何构造具有两个或更多输出节点的感知器吗?它们是否以某种方式链接在一起?
wnstnsmth
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.