“弱学习者”是什么意思?


34

谁能告诉我“弱学习者”是什么意思?它应该是一个弱假设吗?我对学习能力弱和分类能力弱的关系感到困惑。两者相同还是有所不同?

在adaboost算法中,T=10。那是什么意思?我们为什么选择T=10


1
欢迎来到该网站,@ vrushali。我对此进行了编辑,以使英语更加流畅。请确保它仍然说出您的意思。另外,我不确定第二组问题(关于adaboost)是否与第一组问题相同;将它们分成不同的线程可能更有意义。
gung-恢复莫妮卡

Answers:


35

一个“弱”的学习者(分类器,预测器等)只是表现相对较差的一个学习器,它的准确性高于偶然性,但几乎没有。通常但并非总是如此,这意味着计算简单。弱学习者还建议将算法的许多实例(通过增强,装袋等)合并在一起,以创建“强”集成分类器。

在Freund&Schapire的原始AdaBoost论文中提到了这一点:

在这些应用程序中,最令人惊讶的也许是新的“增强”应用程序的派生,即将性能稍好于随机猜测的“弱” PAC学习算法转换为任意高精度。- (Freund&Schapire,1995)

但我认为这个词实际上比这更老了-我见过人们引用1980年代迈克尔·凯恩斯(Michael Kearns)的学期论文(?!)

弱学习者的经典示例是决策树桩,即一个决策树(1R或OneR是另一种常用的弱学习者;它非常相似)。将SVM称为“弱学习者”,即使在它表现不佳的情况下也有些奇怪,但是将单个决策树桩称为弱学习者是完全合理的,即使它本身表现出奇的好。


Adaboost是一种迭代算法,通常表示迭代次数或“回合”次数。该算法首先在数据上训练/测试弱学习者,然后对每个示例进行平均加权。错误分类的示例在下一轮的权重增加,而正确分类的示例的权重降低。T

我不确定有什么神奇之处。在1995年的论文中,T是作为自由参数给出的(即,您可以自行设置)。T=10T


据我所知,DecisionStump与1Rule不同。决策树桩始终是二进制的1级树(用于名义属性和数字属性)。1Rule可以具有2个以上的子代(对于标称值和数字值),对于数字属性,其测试要比按值进行二进制分割要复杂得多。同样,在WEKA中,有2种不同的实现:DecisionStump和OneR。
rapaio 2014年

嗯...我想你是对的。最初的1R论文说:“本文研究的特定类型的规则称为1-Rules,是根据单个属性对对象进行分类的规则(即,它们是1级决策树。”)但是决策树可以在很多不同的方式来实现我将修改清除了。
马特·克劳斯

还有一个本地的OneR实现:CRAN上的OneR包:CRAN.R-project.org/package=OneR,这是小插图:cran.r-project.org/web/packages/OneR/vignettes/OneR。 html(完整披露:我是该软件包的作者)。
vonjd'9

7

弱学习者是一个学习者,当它尝试标记数据时,无论训练数据上的分布是什么,总会比偶然更好。胜于偶然意味着我们总是会得到小于1/2的错误率。

这意味着学习者算法总是要学习一些东西,而不是总是完全准确的,即,在学习之间的关系时,它是薄弱的和较差的X (输入)和 ÿ (目标)。

但是随之而来的是Boosting,我们首先查看训练数据并生成一些分布,然后找到一些错误率低的弱学习者(分类器),每个学习者都输出一些假设,HX。这会产生一些ÿ(类别标签),最后结合好假设集以生成最终假设。

最终提高了弱者的学习能力,并将他们转变为强者。

有关更多信息:https : //youtu.be/zUXJb1hdU0k


欢迎来到简历。由于您是新来的,您可能想参加我们的游览,其中包含有关新用户的信息。。这个答案似乎没有提供新的东西或比以前的答案有所改善。您认为以前的内容中缺少什么吗?
TEG-恢复莫妮卡

为什么要低于1/2。如果错误率高于1/2,则它也应该是弱分类器。
罗马教皇

@CodePope,我的意思是,但是实际上是用这种术语正式定义了“弱学习者”。我同意任何误差超过50%的模型也是差强人意的。但是说到科学家定义的正式定义,一个学习能力较弱的人的错误率小于1/2或50%。
艾妮丝·辛格·瓦利亚

1

弱学习者与弱分类器或弱预测器相同。这个想法是,您使用的分类器是……很好,但是至少比随机分类器好。好处是分类器在过度拟合方面将很强大。当然,您不仅仅使用其中的一个,而是使用大量的集合,每个集合都比随机使用的集合略好。选择/组合它们的确切方法取决于方法/算法,例如AdaBoost。

在实践中,作为弱分类器,您对单个功能使用了简单的阈值。如果特征高于阈值,则您可以预测它属于正值,否则可以确定它属于负值。由于没有上下文,因此不确定T = 10,但是我可以假定这是阈值化某些特征的示例。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.