Answers:
这不容易计算,但只要不能太大。(此数字计算收集优惠券时需要跟踪的可能状态。)
让我们从模拟开始,以了解答案。在这里,我收集了100万次乐高数据。该图中的黑线跟踪收集至少十个不同数字中的三个所需的购买次数的频率。
灰带是每个计数的大约两侧95%置信区间。它的下面是一条红色曲线:这是真实值。
n = 12;
threshold = 10;
k = 3;
(* Draw one object randomly from an urn with `n` of them *)
draw[p_] :=
Expand[Sum[Subscript[x, i] D[#, Subscript[x, i - 1]], {i, 1, k}] +
Subscript[x, k] D[#, Subscript[x, k]] & @ p];
(* Find the chance that we have collected at least `k` each of `threshold` objects *)
f[p_] := Sum[
Coefficient[p, Subscript[x, k]^t] /.
Table[Subscript[x, i] -> 1, {i, 0, k - 1}], {t, threshold, n}]
(* Compute the chances for a long series of draws *)
q = f /@ NestList[draw[#]/n &, Subscript[x, 0]^n, 6 n k];
结果大约需要两秒钟的时间来计算(比模拟要快!)是由抽奖次数索引的概率数组。以下是其差异的图表,它们是根据计数来结束购买的概率:
这些正是第一个图中用于绘制红色背景曲线的数字。(卡方检验表明模拟与该计算没有显着差异。)