我在其他地方读过,NN中隐藏层激活功能的选择应基于自己的需要,即,如果您需要-1到1范围内的值,请使用tanh并使用Sigmoid来表示0到1的范围。
我的问题是如何知道自己的需求?是否基于输入层的范围,例如使用可以包含输入层的整个值范围的函数,还是以某种方式反映输入层的分布(高斯函数)?还是选择特定的需求问题/领域,并需要一个人的经验/判断才能做出选择?还是仅仅是“使用能够提供最佳交叉验证的最小训练误差的东西?”
3
这个参数是bs,因为(tanh + 1)/ 2也是0-1,更不用说“ Sigmoid”这个模糊的术语了,它经常覆盖tanh。
可能值得一提的是,任何数据集都可以归一化为0-> 1并可以使用S型激活
—
阿德里安·塞利
1 + (1 / exp(-sum))
。使得需要非常难于理解而对每一个数据集都尝试。将需要为你在这里形容它是联系在一起的实际关系的有学问,即二进制数据集将学习都给予不同的激活更快与否。