我有一个深层的神经网络模型,需要在包含约100,000个示例的数据集上进行训练,我的验证数据包含约1000个示例。因为训练每个示例都需要时间(每个示例大约需要0.5s),并且为了避免过拟合,我希望尽早停止以防止不必要的计算。但是我不确定如何通过提前停止来正确地训练我的神经网络,这是我现在不太了解的几件事:
好的验证频率是多少?我应该在每个时期结束时在验证数据上检查我的模型吗?(我的批次大小为1)
是否存在前几个时期可能会在开始收敛到更好的价值之前产生更差结果的情况?在这种情况下,在检查是否提前停止之前,我们应该在几个时期内训练我们的网络吗?
当验证损失可能会上升或下降时,该如何处理?在这种情况下,提前停止可能会阻止我的模型进一步学习,对吗?
先感谢您。