我不知道您是否会认为以下微不足道的限制,但是我在这里。
首先,要清楚一点,以免引起混淆 C-DNF与 ķDNF(我经常这样做), C-DNF变量的公式 X1个,… ,Xñ 的形式 ∨ķ我= 1(ℓ我,1∧ℓ我,2。。。ℓ我,Ç) 哪里 ∀ 1 ≤我≤ ķ 和 1个≤ Ĵ ≤ Ç, ℓ我,Ĵ∈ {X1个,… ,Xñ,X¯1个,… ,X¯ñ}。
我们首先要问一个词中可以存在多少个不同的词 C-DNF。每个学期都有C 的 ñ 变量,每个变量是否取反-使 2C(ñC)不同的可能术语。在2-DNF实例中,每个术语都会出现或不出现,使得| H | =22C(ñC) 可能的“目标”,其中 H 是假设空间。
想象一个算法需要 米 采样,然后尝试所有 | H |假设,直到找到一个可以完美地预测样本的样本。 奥卡姆的剃刀定理说,你只需要考虑一下m = O (1个ϵ| ( H | +1个δ) 该算法的样本以查找有错误的目标 ≤ ε 很有可能 ≥ 1 - δ。
就我们而言 c = 2, lg| H | =O(ñ2),这意味着您需要 ñ2 样本进行(正确)学习。
但是学习中的整个游戏并不是真正的样本复杂性(尽管这是游戏的一部分,尤其是在属性有效的学习中),而是尝试设计多项式时间算法。如果您不关心效率,那么ñ2 是PAC样品复杂度的最简单答案。
更新(鉴于已更改的问题):
因为您明确声明只关心样本的复杂性,所以我介绍了蛮力Occam算法,这可能是最简单的参数。但是,我的回答有点y。 2-DNF实际上可以在多项式时间内学习!这是来自Valiant的原始论文“ 可学习的理论”的结果。事实上C-DNF对任何人都是可学的 c = O (1 )。
论据如下。您可以查看C-DNF与 ≈ñC
“元变量”,并尝试通过消除与示例不一致的元变量来学习析取。这样的解决方案可以轻松地转换回“适当的”解决方案,并且O (ñC)时间。附带说明一下,是否存在多项式时间算法c = ω (1 )。
至于是否 ñ2样本复杂度也是一个下限,答案几乎是肯定的。 Ehrenfeucht等人的这篇论文。表明Occam绑定几乎是紧密的。