测验:通过分类边界告诉分类器


17

给出以下6个决策边界。决策边界是紫罗兰色线。点和十字是两个不同的数据集。我们必须确定哪个是:

  • 线性支持向量机
  • 内核化SVM(2阶多项式内核)
  • 感知器
  • 逻辑回归
  • 神经网络(1个隐藏层和10个整流线性单元)
  • 神经网络(1个隐藏层,具有10 tanh单位)

我想要解决方案。但更重要的是,了解差异。例如,我会说c)是线性SVM。决策边界是线性的。但是我们也可以使线性SVM决策边界的坐标均匀化。d)核化的SVM,因为它是多项式阶数2。f)由于“粗糙”的边缘,因此校正了神经网络。也许a)逻辑回归:它也是线性分类器,但基于概率。

决策界限


1
请添加[self-study]标签并阅读其 Wiki。我们将提供提示,以帮助您避免卡住。
gung-恢复莫妮卡

但是不是必须提交的运动。我读了自学文章,但我认为我的文章还好吗?我考虑了自己的想法,也对此进行了思考。我认为也许这个例子对其他人也很有趣。
Miau Piau

1
感谢您添加标签。这不一定要应用我们的政策。这是一个很好的问题; 我投票赞成,但未投票关闭。
gung-恢复莫妮卡

1
可能有助于解释这些图所显示的内容。我认为这些点是用于训练的两组数据,而线是将新点归为一组或另一组的区域之间的边界。那正确吗?
安迪·克里夫顿

1
这可能是我过去5年在任何Stackoverflow / Stackexchange板上看到的最好的问题。令人惊讶的是,在Stackoverflow上会有Javascript骑师,他们会因为“范围太广”而关闭了这个问题。
stackoverflowuser2010

Answers:


9

真的很喜欢这个问题!

首先想到的是线性和非线性分类器之间的划分。三个分类器是线性的(线性svm,感知器和逻辑回归),三个图显示了线性决策边界(ABC)。因此,让我们从这些开始。

线性的

最弱的线性图是图B,因为它有一条带斜率的线。对于逻辑回归和svm来说这很奇怪,因为它们可以通过保持一条直线(即,远离(所有)点)来进一步改善其损失函数。因此,图B是感知器。由于感知器输出为0或1,所以将一个类与另一类分开的所有解决方案都同样好。这就是为什么它没有进一步改善的原因。

情节_A)和C之间的差异更加细微。情节A中的决策边界略低。支持向量机是固定数量的支持向量,而逻辑回归的损失函数是确定所有点的。由于红十字比蓝点多,因此逻辑回归避免红十字比蓝点更多。线性SVM试图与红色支持向量的距离与与蓝色支持向量的距离一样远。这就是为什么图A是逻辑回归的决策边界,而图C是使用线性SVM制作的。

非线性的

让我们继续非线性图和分类器。我同意您的观察,因为图F具有最尖锐的边界,所以它可能是ReLu NN。ReLu单元,如果激活超过0,则立即激活,这将导致输出单元遵循不同的线性线。如果您看起来真的非常好,那么您可以发现直线上的8个方向变化,因此2个单位对最终结果几乎没有影响。因此,图F是ReLu NN。

关于最后两个,我不太确定。tanh NN和多项式内核化SVM都可以具有多个边界。情节D显然被分类为更差。tanh NN可以通过不同程度地弯曲曲线并在外部区域放置更多蓝色或红色点来改善这种情况。但是,这种情节有点奇怪。我猜左上部被分类为红色,右下部被分类为蓝色。但是中间部分如何分类?它应该是红色或蓝色,但是不应绘制决策边界之一。因此,唯一可能的选择是将外部零件分类为一种颜色,将内部零件分类为另一种颜色。那很奇怪,真的很糟糕。因此,我对此不确定。

让我们看看情节ê。它具有曲线和直线。对于2级内核化SVM,很难(几乎不可能)具有直线决策边界,因为平方距离逐渐偏向于2类中的1类。tanh激活函数的悬停可能会饱和,以使隐藏状态由0和1组成。如果只有1个单位然后将其状态更改为.5,则可以得到线性决策边界。因此,我想说图E是一个tanh NN,因此图D是一个内核化的SVM。但是,这对于可怜的旧SVM不利。

结论

A -Logistic回归
B-感知器
C-线性SVM
D-核化SVM(2阶多项式核)
E-神经网络(1个包含10 tanh单位的隐藏层)
F-神经网络(1个具有10个校正线性单位的隐藏层)


谢谢你的回答。我也喜欢这个问题。它为分类器提供了新的视角。SVM具有最大的余量,因此该行位于数据中间是有意义的。但是,为什么逻辑回归也是如此?
Miau Piau

你的意思是为什么它是直的?还是为什么在中间?
Pieter'8

您说“他们可以通过成为一条平线来进一步改善其亏损功能”-为什么要进行逻辑回归?
Miau

1
从理论上讲,这是最好的解决方案,因为一条斜线会更快地降低更近距离类别的正确概率,而不是增加更远距离类别的概率。
Pieter'8
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.