统计查询模型算法?


13

我在交叉验证的问答中问了这个问题,但似乎它与CS的关系远大于与Statistics的关系。

您能否给我一些机器学习算法的示例,这些算法从数据集的统计属性中学习,而不是从单个观测值本身中学习,即采用统计查询模型


1
什么是统计查询模型?
Suresh Venkat

来自Kearns纸portal.acm.org/citation.cfm?doid=293347.293351:“在此模型中,禁止使用学习算法来检查未知目标函数的各个示例,但必须使用oracle来提供样本概率估计随机示例空间。”。抱歉,如果不是很明显,我已经通过文件链接更新了我的问题
Deyaa 2010年

Answers:


14

几乎所有可以在PAC模型中使用的算法(奇偶学习算法除外)都可以在SQ模型中使用。参见例如Blum等人的本文。其中将几种流行的算法转换为它们的SQ等效项(实用隐私:SuLQ框架)。本文原则上涉及“隐私”,但是您可以忽略它-实际上,它只是使用SQ查询实现算法。

另一方面,不可知论学习在SQ模型中要困难得多:撇开计算问题(尽管这些很重要),不可知论学习所需的样本复杂度与精确学习所需的样本复杂度大致相同(如果您实际上可以使用)数据点。另一方面,不可知学习在SQ模型中变得更加困难-即使对于像单调析取之类的简单类,您通常也需要进行多项式查询。请参阅Feldman 撰写的这篇论文(统计查询学习的完整特征及其对可进化性的应用)或Gupta等最近发表的这篇论文。(私下释放连词和统计查询障碍


非常好的答案亚伦:)非常感谢:)
Deyaa 2010年

7

制作SQ模型是为了分析噪声容忍的学习-即通过进行统计查询而起作用的算法将在分类噪声下起作用。正如Aaron所说,我们证明大多数PAC算法在SQ模型中具有等效功能。一个例外是高斯消去法,它用于学习奇偶校验(甚至可以巧妙地应用它)在分类噪声模型中学习log(n)loglog(n)大小奇偶性。我们还知道,统计查询无法学习奇偶校验,事实证明,像决策树这样的最有趣的类可以模拟奇偶校验功能。因此,在为许多有趣的类(例如决策树,DNF等)获取PAC学习算法的过程中,我们知道我们需要根本上在统计查询模型中不起作用的新学习算法。


有趣。您是否有参考资料无法在SQ模型中学习奇偶校验?
M. Alaggan

1
Kearns在其定义模型的原始论文中证明了这一点:portal.acm.org/citation.cfm?doid=293347.293351,然后由Blum等人再次展示,他们定义了类portal.acm.org/citation的SQ维度。.cfm?id = 195058.195147。基本上,论点是这样的:奇偶校验是“成对独立的”,并且具有均匀分布,因此您几乎必须猜测正确的奇偶校验才能学到任何东西,并且有很多可能的奇偶校验……
列夫·雷津

5

我想稍微澄清一下亚伦的回应。几乎可以使所有不可知论算法(除了使用高斯消除的任何算法都可以再次执行)在SQ模型中起作用。自然,不可知学习比非不可知学习困难,但这是一个独立的问题。


/ϵ2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.