Answers:
是的,这出于技术原因很重要。基本上是为了优化。值得阅读LeCun等人的《高效反向传播》。
做出此选择有两个原因(假设您已经对数据进行了标准化,这非常重要):
tanh函数的范围是[-1,1],而S型函数的范围是[0,1]
非常感谢@jpmuc!受您的回答启发,我分别计算并绘制了tanh函数和标准S型函数的导数。我想与大家分享。这就是我得到的。这是tanh函数的导数。对于[-1,1]之间的输入,我们具有[0.42,1]之间的导数。
这是标准S型函数f(x)= 1 /(1 + exp(-x))的导数。对于[0,1]之间的输入,我们具有[0.20,0.25]之间的导数。
显然,tanh函数提供了更强的渐变。