无法有效计算但可学习的功能


28

我们知道(例如,参见[1]的定理1和定理3),粗略地说,在适当的条件下,可以由多项式神经网络表示可以由图灵机在多项式时间内有效计算的函数(“有效可计算”)。具有合理的大小,因此可以在任何输入分布下以多项式样本复杂度(“可学习的”)来学习。

此处的“可学习的”仅涉及样本复杂度,而与计算复杂度无关。

我想知道一个非常相关的问题:是否存在一个图灵机无法在多项式时间内有效计算的函数(“无法有效计算”),但同时可以通过多项式样本复杂度来学习(“可学习”)在任何输入分布下?


4
我对“因此可以学习”表示质疑。有非常高效的可计算函数(例如DFA),很难学习,甚至很难学习。
Aryeh

3
这可能遗漏了要点,但是偏布尔函数的类又如何呢?(即,或多或少的随机函数,每个值独立地为,概率为)。对于任何,在均匀分布下进行PAC学习都是微不足道的(需要0个样本,常数函数是一个很好的假设),但是似乎任何评估算法都需要花费超多项式时间(因为该函数没有结构)。不过,我很可能会误解这个问题。2 - Ñ 12-2n1Ñ ε>2-2nn 0ε>2n0
Clement C.

3
您的术语有点混乱。当我们说“有效学习”时,我们通常指的是计算效率。只需说“可学习”就足以暗示采样效率。
列夫·雷津

1
@Minkov要学习PAC,您应该学习任何发行版。否则,这个问题就没有意思了(正如克莱门特指出的那样)。
列夫·雷津

2
人们为什么投票关闭?我认为这是一个深刻而微妙的问题!
Aryeh

Answers:


11

我将形式化此问题的一个变体,用“可计算性”代替“效率”。

ç ñCn是概念类的所有语言的大号⊆ Σ *LΣ 识别由图灵机上ñn状态或更少。一般地,对于X Σ *xΣ˚F Ç ÑfCn,评估的问题 ˚F X f(x)是不可判定。

但是,假设我们有机会获得一个(适当的,可实现的)PAC-学习oracle的AÇ ñCn。也就是说,对于任何ϵ δ > 0ϵ,δ>0,oracle都请求一个标记的大小为 m 0n ϵ δ m0(n,ϵ,δ) 的样本,使得假设从未知分布DD抽取了该样本,oracle AA输出了一个假设˚Fç ñ ,其与概率至少1 - δ,具有df^Cn1δD-generalization误差不超过εϵ。我们将证明该预言不是图灵可计算的。

事实上,我们将证明一个简单的问题是不可判定:一个确定的,给予标记的样品小号S,是否存在一个˚F ç ñfCn符合小号S。假设(矛盾)KK是决定一致性问题的图灵机。

我们制定以下符号约定。识别Σ *ΣÑ = { 0 1 2 ... }N={0,1,2,}经由通常的词典式排序。对于X { 0 1 } *x{0,1},我们说一个TM 中号M “S-打印” Xx它是否接受所有在串的Σ *Σ 对应于索引i ST X = 1xi=1 ,并且不通过不接受(可能停止)与索引x对应的任何字符串i = 0xi=0。由于(通过假设) ķK是可判定的,接下去的功能ķX ķK~:xk,定义为最小的 ķk使得在一些TM Ç ķCk S-打印 Xx,是图灵不可计算的。它进一步如下所述功能 ķ Xg:kx,其中映射 ķ Ñ 到至少(按字典顺序)串 X { 0 1 } * 使得ķX> k也是可计算的。

现在定义TM 中号如下:中号 S-打印|中号|,其中 中号是的编码中号| x | 表示字符串长度,并调用递归定理以断言此类M的存在。然后中号具有一定的编码长度,= | 中号| ,它为S打印一些串,X 中号{ 0 1 } *。通过构造,ķX 中号> ,所以X 中号不能由与描述长度任何TM S-印刷或更短。但是,它被定义为描述长度为 ---的TM的S打印输出。


2
挑战:通过可计算性将我的“无限式”论点转换为通过效率的最终式。我认为@minkov问题的答案是否定的:您无法有效学习无法有效评估的函数类。我认为,如果您超出适当的或可实现的PAC,这将继续是正确的。
Aryeh
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.