我目前正在阅读John Duchi和Yoram Singer撰写的论文《使用正反拆分进行有效的在线和批处理学习》。我对术语“在线”和“批处理”的使用感到非常困惑。
我认为“在线”是指我们在处理了一个单位的训练数据后更新了体重参数。然后,我们使用新的权重参数来处理训练数据的下一个单位。
但是,在上面的文章中,用法尚不清楚。
我目前正在阅读John Duchi和Yoram Singer撰写的论文《使用正反拆分进行有效的在线和批处理学习》。我对术语“在线”和“批处理”的使用感到非常困惑。
我认为“在线”是指我们在处理了一个单位的训练数据后更新了体重参数。然后,我们使用新的权重参数来处理训练数据的下一个单位。
但是,在上面的文章中,用法尚不清楚。
Answers:
在我看来,他们似乎正在正确使用批处理和在线学习。在第3节中,他们正在整个数据集上执行学习,即批处理学习,而在第4节中,他们切换到随机梯度,随后可以将其用作在线学习算法。
我从未将随机梯度跟踪用作在线学习算法;但是,有可能在学习过程的中间简单地停止优化过程,并且它仍然是有用的模型。对于非常大的数据集,这很有用,因为您可以测量收敛性并尽早退出学习。您可以使用随机梯度跟踪作为在线学习方法,因为您为每个新数据点更新了模型,就像我自己说的那样。不过,我会谨慎地称其为“每个训练数据”。训练数据是数据集,而不是数据点,但是我想我理解您的意思,因为您说的是“ 每个训练数据”。
简而言之,
在线:根据观察到的每种模式进行学习。
批次:学习各种模式。大多数算法是批处理的。
资料来源:http : //machinelearningmastery.com/basic-concepts-in-machine-learning/