监督学习
- 1)人们根据输入和输出数据构建分类器
- 2)使用训练数据集对分类器进行训练
- 3)该分类器已通过测试数据集进行了测试
- 4)如果输出令人满意,则进行部署
在以下情况下使用:“我知道如何对这些数据进行分类,我只需要您(分类器)对其进行分类即可。”
方法要点:分类标签或产生实数
无监督学习
- 1)人们根据输入数据建立算法
- 2)使用一个测试数据集测试该算法(该算法在其中创建分类器)
- 3)如果分类器令人满意,则进行部署
在以下情况下使用:“我不知道如何对这些数据进行分类,您(算法)可以为我创建分类器吗?”
方法要点:分类标签或预测(PDF)
强化学习
- 1)人们根据输入数据建立算法
- 2)该算法呈现取决于输入数据的状态,在该状态下,用户通过算法采取的行动来奖励或惩罚该算法,这种状态会随着时间的流逝而持续
- 3)该算法从奖励/惩罚中学习并自我更新,这继续
- 4)始终处于生产状态,它需要学习真实数据以能够呈现状态下的动作
在以下情况下使用:“我不知道如何对这些数据进行分类,您可以对这些数据进行分类,如果正确的话我会给您奖励,如果不正确的话我会给您惩罚。”
这是那种这些做法的流量,我听到了很多关于他们做什么,但实际和示范性的信息是令人吃惊的小!
非常喜欢您提出问题的方式。我发现此答案很有帮助:stats.stackexchange.com/a/522/92255
—
Ashesh Kumar Singh,