为什么softmax用于表示概率分布?


Answers:


7

从优化角度来看,它在可微性方面具有一些不错的属性。对于很多机器学习问题,它非常适合N分之一分类。

从深度学习的角度来看:还可以说,从理论上讲,使用具有顶部maxmax分类器的深度网络可以表示特征空间上的任何N类概率函数,因为MLP具有通用近似属性。


1
因此,Softmax受欢迎的主要原因是其出色的差异性,这对于基于梯度的学习设置很有帮助。就是这样吧?
SHASHANK GUPTA

是的,无论如何,我认为。Softmax简单易用,具有良好的派生性,对于基于梯度的学习非常有吸引力。同意你所说的一切。
独立AI

您可以将softmax视为要优化的函数的概率质量/密度函数。在我看来,softmax只是对概率质量/密度函数建模的一种简便方法。
周星驰

3

Softmax也是logistic Sigmoid函数的一般化,因此它具有Sigmoid的属性,例如易于区分并且在0-1范围内。logistic Sigmoid函数的输出也在0和1之间,因此自然是表示概率的合适选择。它的导数也根据其自身的输出进行计算。但是,如果函数具有向量输出,则需要使用Softmax函数来获取输出向量上的概率分布。使用Indie AI提到的Softmax还有其他一些优点,尽管它不一定与通用逼近理论有任何关系,因为Softmax并非仅用于神经网络的功能。

参考文献

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.