鉴于


11

这是一个与学习军人类似的问题:

输入:函数,由隶属度oracle表示,即给定的oracle 返回f x XF{01个}ñ{-1个1个}XFX

目标:查找子多维数据集小号{01个}ñ与体积|小号|=2ñ-ķ使得|ËX小号FX|0.1。我们假定存在这样的子多维数据集。

这是很容易得到一个算法,在时间用完ñØķ和回报的概率一个正确的答案0.99通过尝试所有2ñķ的方式来选择子多维数据集和采样平均每一个。

我对找到一种可以在时间中运行的算法很感兴趣pØÿñ2ķ。替代地,下界将是巨大的。这个问题类似于学习军政府,但我看不出它们的计算难度之间存在实际联系。

更新:@Thomas下面证明了此问题的样本复杂度为pØÿ2ķ日志ñ。有趣的问题仍然是问题的计算复杂性。

编辑:为简单起见,您可以假设存在一个带有的子多维数据集Ë X 小号 ˚F X | 0.2|ËX小号FX|0.2(通知的差距:我们正在寻找与平均子多维数据集0.1)。我敢肯定,任何解决问题的差距也将解决这个问题没有差距。

Answers:


7

这是样本复杂度的一个更好的界限。(尽管计算复杂度仍为。)ñķ

定理。 假设存在一个大小为2 n k的子立方体,使得| È X 小号 [ ˚F X ] | 0.12。与Ô 2 ķķ 登录Ñ 样品,我们可以,以高概率,确定一个子立方体小号'大小的2 ñ - ķ使得| È X 小号' [ ˚F小号2ñ-ķ|ËX小号[FX]|0.12Ø2ķķ日志ñ小号2ñ-ķ|ËX小号[FX]|0.1

请注意,参数损失很小(最佳值为,而保证值为0.1)。0.120.1

证明。P { 0 1 } Ñ均匀随机和查询˚F在每个X PP{01个}ñFXP

固定子多维数据集尺寸的2 ñ - ķ。我们有E [ | 小号P | ] = 中号2 - ķ。由切尔诺夫界线,P [ | 小号P | < 2 - ķ - 1 ] 2 - Ω 2 - ķP [ | Ë X 小号小号2ñ-ķË[|小号P|]=2-ķ

P[|小号P|<2-ķ-1个]2-Ω2-ķ
P[|ËX小号P[FX]-ËX小号[FX]|>ε]2-Ω|小号P|ε2

ñķ2ķ小号

P[小号  |ËX小号P[FX]-ËX小号[FX]|ε]1个-ñķ2ķ2-Ω2-ķε2
=Ø2ķ/ε2ķ日志ñ0.99ËX小号[FX]ε小号2ñ-ķ

ε=0.01|ËX小号P[FX]|


1
C2ķCCñķ

3
另一种看待这种情况的方式是,您描述的范围空间具有有界的粉碎维度,因此也有界VC维度,然后向其抛出eps逼近定理。
Suresh Venkat 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.