Answers:
套包和辍学并不能达到完全相同的目的,尽管两者都是模型平均的类型。
套袋是对整个数据集的一项操作,可根据一部分训练数据来训练模型。因此,某些训练示例未显示给定模型。
相反,Dropout应用于每个训练示例中的功能。的确,结果在功能上等效于对多个网络进行指数训练(具有相同的权重!),然后对其输出进行平均加权。但是,辍学在要素空间上起作用,从而导致某些要素无法使用网络,而不是完整的示例。由于每个神经元不能完全依赖一个输入,因此这些网络中的表示形式倾向于更分散,并且网络不太可能过拟合。
我在Max Out Networks中找到了两种网络的比较:
辍学训练类似于装袋(Breiman,1994年),其中许多不同的模型针对数据的不同子集进行训练。辍学训练与套袋训练的不同之处在于,每个模型仅训练一个步骤,并且所有模型共享参数。为了使此训练过程(辍学)表现得像在训练一个集合而不是一个模型,每个更新必须具有很大的效果,以便使由该µ引起的子模型很好地适合当前输入v。
希望它会有用。