感知器可以忘记吗?


16

我想建立一个基于网络的在线机器学习系统,用户可以在其中连续添加分类的样本,并在线更新模型。我想使用感知器或类似的在线学习算法。

但是,用户可能会犯错误并插入不相关的示例。在那种情况下,我想选择删除一个特定的示例,而无需对整个示例集(可能很大)上的感知器进行重新训练。

这可能吗?


非常有趣的主意。您是否已努力将其正式化?
斯特林,

给定您的感知器模型和分类器的详细信息,当您使用正确的分类重新插入示例时会发生什么?这样是否可以减少错误的内层神经元的权重并增加正确的内层神经元的权重?
逻辑徘徊

1
重新插入样本显然可以在某种程度上有所帮助,但是,我不确定在这种情况下感知器的正确性和收敛性是否成立(即,我不确定结果是否与错误样本存在的情况相同)。未插入第一位)。
Erel Segal-Halevi

作为一个简单的解决方案,您可以在添加每个新样本之前记录一下感知器的重量。然后,当您要消除样本时,将感知器的权重(重新)设置为添加“不良”示例之前的权重,并使用“不良”示例之后添加的所有有效示例重新训练感知器。这将涉及一些重新培训,但不涉及全部示例。当然,您还必须维护示例及其相关权重的记录。
rphv

Answers:


6

据我了解的过程,不重新训练就不可能改变感知器。权重调整不仅相对于该特定示例,还相对于之前的其他培训示例。在重新训练模型之前,识别分类错误的实例并将其从测试集中删除似乎是校正权重的最有效方法。

我认为值得指出的是,与其他机器学习算法相比,感知器在训练集中相对抗噪声和分类错误的实例。如果您遇到大量错误分类的实例,那么在训练之前摄取数据时进行更好的验证似乎比在训练感知器后提出某种纠正错误分类实例的方法更为明智。如果那是不可能的,并且您能够这样识别错误分类的实例,那么删除它们并进行重新培训似乎是有效消除错误分类实例影响的唯一方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.