在CNN中的人脸/非人脸检测中，应使用哪种丢失函数进行二进制检测？

11

我想使用深度学习来训练面部/非面部二进制检测，我应该使用什么损失，我认为这是SigmoidCrossEntropyLoss或Hinge-loss。

是这样，但是我也想知道我应该只使用softmax但只有两个类吗？

deep-learning loss-functions computer-vision conv-neural-network

— 用户名
source

9

通常发现铰链损失和交叉熵具有相似的结果。这是另一篇比较不同损失函数的文章，在分类中选择不同损失函数以近似0-1损失有什么影响。

是这样，但是我也想知道我应该只使用softmax但只有两个类吗？

Softmax不是损失，而是归一化函数，它经常与交叉熵损失（通常等于）一起使用SigmoidCrossEntropyLoss。另请参见输出层中的交叉熵或对数似然

— Dontloo
source

7

通常，当您遇到样本只能属于一组类中的一个类的问题时，可以将最后一层设置为soft-max层。它使您可以将输出解释为概率。当使用soft-max层时，交叉熵通常效果很好，因为交叉熵中的对数项抵消了soft-max函数中存在的平稳段，因此加快了学习过程（认为点很远）从S型函数的）。 $0$

在您的情况下，您有一个二进制分类任务，因此您的输出层可以是标准S形（其中输出表示测试样本为人脸的概率）。您将使用的损耗将是二进制交叉熵。通过这种设置，您可以想象在深度神经网络的最后一层进行逻辑回归。

— 亚曼·阿格贾扬扬（Armen Aghajanyan）
source

您能否在DNN的最后一层阐明逻辑回归？我已经阅读了帖子，但看不到它的实用性sigmoid（作为最后一层激活）。谢谢

— bit_scientist

2

您绝对可以只将softmax与“ Face”和“ Not Face”两个类一起使用，并将softmax的输出解释为置信度得分，这是一个很好的功能，可以使您深入了解自己的深层网络。

尝试2类softmax和二进制铰链损耗。最近有一篇论文使用深度支持网络之上的使用线性支持向量机的深度学习，该线性支持向量机使用SVM而不是softmax分类器，并且那里有一些令人鼓舞的结果。

— 独立AI
source

2

通常，对数损耗是首选，仅与单个输出单元结合使用。对数损失也称为二进制交叉熵，因为它是交叉熵的一种特例，仅适用于两个类别。

— 精英
source

您应该更新第一个链接。

— nbro

0

从理论上讲，具有2个类的softmax可以重写为S型，因此两者之间的结果应该没有差异。实际上，就像@dontloo提到的那样，输出层中的参数数量将是两倍（不确定这是否会导致任何过拟合问题），当然，对于这两个类（Face和Non_Face），您将获得2分。

— 阿肯卡
source