在经典的Coupon Collector问题中,众所周知,完成一组随机挑选的优惠券所需的时间满足,和。
这个上限比切比雪夫不等式给出的上限更好,后者约为 。
我的问题是:是否有相应优于切比雪夫下限为?(例如,类似)?
在经典的Coupon Collector问题中,众所周知,完成一组随机挑选的优惠券所需的时间满足,和。
这个上限比切比雪夫不等式给出的上限更好,后者约为 。
我的问题是:是否有相应优于切比雪夫下限为?(例如,类似)?
Answers:
我将其作为第二个答案,因为分析是完全基本的,并且可以提供所需的结果。
命题对于和,
证明背后的想法很简单:
证明
对于任何和任何,我们具有 小号> 0 P(Ť < 吨)= P(ë - 小号Ť > ë - 小号吨)≤ Ë 小号吨 ë ë - 小号Ť
由于和是独立的,因此我们可以写 T i E e - s T = n ∏ i = 1 E e - s T i
现在,既然是几何的,那么以成功的概率,那么一个简单的计算显示 p i E e - s T i = p i
对于我们的问题,为,,等,因此 p 1 = 1 p 2 = 1 - 1 / Ñ p 3 = 1 - 2 / Ñ Ñ Π我= 1 ë ë - 小号Ť 我 = Ñ Π我= 1我/ Ñ
让我们为某些选择 和。然后 和,产生 吨= ñ 登录ñ - ç Ñ ç > 0 Ë 小号吨 = Ñ ë - C ^ Ë 小号 = ë 1 / Ñ ≥ 1 + 1 / Ñ Ñ Π我= 1我/ Ñ
放在一起,我们得到
如预期的。
尽管@cardinal已经给出了一个答案,该答案给出了我一直在寻找的界限,但是我发现了类似的Chernoff风格的论点,可以给出一个更强的界限:
命题: (对于来说更强)
证明:
就像@cardinal的答案一样,我们可以使用是具有成功概率的独立几何随机变量之和的事实。因此,和。
现在定义新变量和。然后我们可以写
计算平均值,我们有
因此,由于,我们可以写
最小化,我们最终获得 镨(Ť ≤ ñ 登录ñ - Ç Ñ )≤ ë - 3 c ^ 2
重要说明:我决定删除我最初在此答案中提供的证明。与我提供的其他证明相比,它更长,计算量更大,使用的锤子更大,并且证明了结果较弱。到处都是(我认为)劣等的方法。如果您真的有兴趣,我想您可以看看所做的修改。
我最初引用的渐近结果仍然可以在下面的答案中找到,该结果确实表明,对于我们可以做的比其他答案中证明的界更好,后者适用于所有。
下列渐近结果成立
和
常数和极限取为。请注意,尽管将它们分为两个结果,但它们几乎是相同的结果,因为在任何情况下都不会被约束为非负数。
有关证明,请参见例如Motwani和Raghavan的《随机算法》,第60--63页。
另外:大卫请为这个答案的注释中的陈述上限提供证明。
本杰明·杜尔给(本章“分析随机搜索的启发式:从概率论工具”中的书“随机搜索的启发式理论”,见链接在线PDF)的稍显简单的证明
命题设是优惠券收集过程的停止时间。然后。
这似乎给出了所需的渐近性(来自@cardinal的第二个答案),但具有对所有和成立的优点。
这是一个证明草图。
证明草图:假设是在第抽奖中收集到第个优惠券的事件。因此,。关键的事实是,是负相关的,对于任何,。直观地说,这是相当清楚的,因为明知在第一个券平会使其不太可能的是,个券也被拉在第一平局。
可以证明要求,但在每一步将集合放大1。然后,它为对显示。等效地,通过平均,它简化为显示。Doerr为此仅给出了直观的论据。证明的一种途径如下。可以观察到,以所有优惠券之后的优惠券为条件,到目前为止,在抽取之后从抽取新优惠券的概率现在为,而不是以前的j I I k | 我| − k | 我| −k Ĵ我。因此,将收集所有优惠券的时间分解为几何随机变量的总和,我们可以看到对优惠券的调节是在增加成功概率之后进行的,因此进行调节只会使其更有可能更早地收集优惠券(通过随机优势:就随机优势而言,每个几何随机变量都通过条件调节而增加,然后可以将该优势应用于总和。
给定这种负相关性,则得出,期望界。吨= (1 - ε )(ñ - 1 )LN Ñ