Answers:
两点:
无论如何,我对神经网络的实证研究有些怀疑。从网络拓扑到梯度下降优化过程再到激活函数以及要测试的任何内容(如正则化),都有太多的超参数需要微调。然后,整个过程都是随机的,并且通常性能提升非常小,以至于您几乎无法统计测试差异。许多作者甚至不理会统计测试。他们只是对交叉验证进行平均,然后宣布具有最高小数点增益的任何模型都将成为赢家。
您可能会发现一项促进辍学的研究仅与另一项促进正规化相抵触。
我认为这都归结为美学偏好。辍学恕我直言听起来比正常化更具生物学可行性。似乎也更容易校准。因此,当使用TensorFlow之类的框架时,我个人更喜欢它。如果必须经常使用我们自己的神经网络,则将使用正则化,因为它更易于实现。
绝对是 创作者本人杰弗里·欣顿的论文。https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf阅读。但我鼓励您自己实现这一差异。