我想建立一个基于网络的在线机器学习系统,用户可以在其中连续添加分类的样本,并在线更新模型。我想使用感知器或类似的在线学习算法。
但是,用户可能会犯错误并插入不相关的示例。在那种情况下,我想选择删除一个特定的示例,而无需对整个示例集(可能很大)上的感知器进行重新训练。
这可能吗?
非常有趣的主意。您是否已努力将其正式化?
—
斯特林,
给定您的感知器模型和分类器的详细信息,当您使用正确的分类重新插入示例时会发生什么?这样是否可以减少错误的内层神经元的权重并增加正确的内层神经元的权重?
—
逻辑徘徊
重新插入样本显然可以在某种程度上有所帮助,但是,我不确定在这种情况下感知器的正确性和收敛性是否成立(即,我不确定结果是否与错误样本存在的情况相同)。未插入第一位)。
—
Erel Segal-Halevi
作为一个简单的解决方案,您可以在添加每个新样本之前记录一下感知器的重量。然后,当您要消除样本时,将感知器的权重(重新)设置为添加“不良”示例之前的权重,并使用“不良”示例之后添加的所有有效示例重新训练感知器。这将涉及一些重新培训,但不涉及全部示例。当然,您还必须维护示例及其相关权重的记录。
—
rphv