铰链损失可以使用定义和日志损失可以被定义为
我有以下问题:
铰链丢失是否存在任何缺点(例如,对http://www.unc.edu/~yfliu/papers/rsvm.pdf中提到的异常值敏感)?
一个与另一个相比有什么区别,优点和缺点?
铰链损失可以使用定义和日志损失可以被定义为
我有以下问题:
铰链丢失是否存在任何缺点(例如,对http://www.unc.edu/~yfliu/papers/rsvm.pdf中提到的异常值敏感)?
一个与另一个相比有什么区别,优点和缺点?
Answers:
对数损失最小化会导致行为表现良好。
铰链损失会导致对偶出现某种程度的稀疏性(但不能保证),但对概率估计没有帮助。相反,它会惩罚分类错误(这就是确定边距如此有用的原因):减少铰链损耗伴随着减少边距错误分类。
因此,总结一下:
对数损失导致以准确性为代价的更好的概率估计
铰链损失导致更好的准确性和一些稀疏性,但代价是对概率的敏感性大大降低
@Firebug的回答很好(+1)。实际上,我在这里也有类似的问题。
我只想在后勤损失的另一个主要优势上添加更多信息:概率解释。一个例子,可以在这里找到
具体地说,逻辑回归是统计文献中的经典模型。(请参阅“ Logistic回归”这个名称的含义。)有许多与Logistic损失有关的重要概念,例如最大化对数似然估计,似然比检验以及对二项式的假设。这里是一些相关的讨论。