远距离监督:监督,半监督或两者兼而有之?


20

“远距离监督”是一种学习方案,其中在给定标记较弱的训练集的情况下学习分类器(训练数据基于启发式/规则自动标记)。我认为监督学习和半监督学习都可以通过“启发式/自动标记”来标记这种“远程监督”。但是,在此页面中,“远程监督”被定义为“半监督学习”(即,仅限于“半监督”)。

所以我的问题是,“远程监管”是否专门指半监管?我认为它可以应用于监督学习和半监督学习。请提供任何可靠的参考。

Answers:


22

远程监督算法通常包含以下步骤:
1]它可能具有一些标记的训练数据
2]它“具有”对未标记数据池的访问权
3]它具有一个运算符,允许它从该未标记数据中采样并标记它们并期望该运算符在其标签中带有噪声[
4]。然后,该算法将集体使用原始标记的训练数据(如果有的话)和该新的经过噪声标记的数据以提供最终输出。

现在,要回答您的问题,您和站点都正确。您正在查看算法的第四步,请注意,在第四步,您可以使用用户有权访问的任何算法。因此,您的观点是,“它可以应用于监督学习和半监督学习”

站点正在集体查看第1-4步的所有步骤,并注意到经过嘈杂标记的数据是从一组未标记数据(使用或不使用某些预先存在的标记训练数据)中获得的,而获取噪声标签的这一过程是任何远程监管算法的必要组成部分,因此它一种半监管算法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.