Answers:
在线学习意味着您在输入数据时就在做。离线意味着您拥有静态数据集。
因此,对于在线学习,您(通常)具有更多数据,但是您有时间限制。可能影响在线学习的另一个问题是您的概念可能会随着时间而改变。
假设您要构建一个分类器来识别垃圾邮件。您可以获取大量的电子邮件,对其进行标记,然后在其上训练分类器。这将是离线学习。或者,您可以接收所有进入系统的电子邮件,并不断更新分类器(标签可能有点棘手)。这将是在线学习。
术语“在线”过载,因此在机器学习领域引起混乱。
“在线”的相反是批处理学习。在批处理学习中,学习算法在消耗了整个批处理之后更新其参数,而在在线学习中,该算法在从1个训练实例学习后更新了其参数。迷你批处理学习是一端的批处理学习和另一端的在线学习之间的中间点。
同样,“何时”输入数据或是否能够存储数据与在线或批处理学习正交。
与批处理学习相比,在线学习被认为收敛于最小值的速度较慢。但是,在整个数据集都不适合存储的情况下,使用在线学习是可以接受的折衷方案。