均匀随机地绘制n个间隔,至少一个间隔与所有其他间隔重叠的概率


17

随机绘制Ñn从间隔[ 0 1 ][0,1],其中每个端点A,B是从均匀分布之间选择[ 0 1 ][0,1]

至少一个间隔与所有其他间隔重叠的概率是多少?


您可以查看最后绘制的A nAn小于所有先前绘制的A的最小值A的概率,以及最后一个B nBn大于所有先前绘制的B的最大值的概率B这应该会有所帮助。然后增加概率,以说明以下事实:我们不需要最后一个,而是任何一个。(我没有时间来解决它,但是看起来好像是个有趣的小问题。祝您好运!)
S. Kolassa-恢复莫妮卡2015年

(1)答案不取决于分布(仅是连续的),并且(2)对于n > 1,n>1它是常数可能有些令人惊讶。
whuber

1
这是第n个间隔的构造方式:i)从[0,1]随机均匀地画出两个数,ii)设较小的一个为A nAn,较大的一个为B nBn
ekvall 2015年

Answers:


5

这篇文章回答了这个问题,并概述了证明它正确的部分进展。


对于n = 1,答案平凡为1。对于所有的较大Ñ,它是(令人惊讶的)总是2 / 3n=11n2/3

要了解原因,请首先观察到该问题可以推广到任何连续分布F(代替均匀分布)。生成n个间隔的过程相当于从F提取2 n个 iid变量X 1X 2X 2 n并形成间隔Fn2nX1,X2,,X2nF

[ min X 1X 2max X 1X 2] [ min X 2 n - 1X 2 nmax X 2 n - 1X 2 n]

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

因为所有2 ñ的的X 是独立的,它们是可更换的。 这意味着,如果我们随机排列所有这些,则解决方案将是相同的。因此,让我们X i进行排序获得的订单统计为条件:2nXiXi

X 1 < X 2 < < X 2 n

X(1)<X(2)<<X(2n)

(其中,因为F是连续的,所以任意两个相等的可能性为零)。的Ñ间隔通过选择一个随机排列形成σ &Element; s ^ 2 Ñ和它们对连接FnσS2n

[ 分钟X σ 1 X σ 2 最大X σ 1 X σ 2 ] ... [ 分钟X σ 2 Ñ - 1 X σ 2 ñ 最大X σ 2ñ - 1 X σ 2 Ñ ]

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

无论这些重叠的任何两种或不不依赖于所述的值X X(i)因为重叠由任何保留的任何单调变换˚F - [R[R和有这样的变换即发送X 。因此,在不失一般性的情况下,我们可以取X i = i,问题变为:f:RRX(i)iX(i)=i

让集合{ 1 2 ... 2 ñ - 1 2 ñ }被划分为ñ不相交doubletons。任何他们两个,{ 1- [R 1 }{ 2- [R 2 }(具有 < ř ),重叠时和{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir 1 > l 2 r 2 > l 1 nr1>l2r2>l1。假设一个分区的至少一个元素与所有其他元素重叠(否则为“坏”),则该分区为“好”。作为的函数,良好分区的比例是多少?n

为了说明,考虑情况。一共有三个分区n = 2n=2

{ { 1 2 } { 3 4 } }{ { 1 4 } { 2 3 } }{ { 1 3 } { 2 4 } }  

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

其中两个好的(第二个和第三个)已被涂成红色。因此,在的情况下的答案是。Ñ = 2 2 / 3n=22/3

我们可以通过在数字线上绘制点来绘制这样的分区在每个和之间绘制线段,将它们稍微偏移以解决视觉重叠。以下是前三个分区的图,以相同的顺序和相同的颜色:{ { l ir i } = 1 2 ... Ñ } { 1 2 ... 2 Ñ } ř {{li,ri},i=1,2,,n}{1,2,,2n}liri

图1

从现在开始,为了方便地以这种格式拟合这些图,我将它们横向倾斜。例如,这是的分区,再次用红色标记好分区:15 n = 315n=3

图2

十都很好,所以对于答案是。Ñ = 3 10 / 15 = 2 / 3n=310/15=2/3

当时出现第一个有趣的情况。现在,这是第一次,间隔的并集可以跨越到而其中任何一个都不与其他相交。一个示例是。线段的并集从到连续运行,但这不是一个很好的分区。尽管如此,在分区中有分区是好的,并且比例仍然是。Ñ = 4 1 2 Ñ { { 1 3 } { 2 5 } { 4 7 } { 6 8 } } 1 8 70 105 2 / 3n=412n{{1,3},{2,5},{4,7},{6,8}}18701052/3


分区数随着迅速增加:等于。直到为止,所有可能性的穷举枚举继续产生作为答案。通过进行的蒙特卡洛仿真(每个仿真使用次迭代)显示出与偏差不大。nn1352n1=(2n)!/(2nn!)1352n1=(2n)!/(2nn!)n=7n=72/32/3n=100n=10010000100002/32/3

我相信,有一种聪明,简单的方法来演示总有的好坏分区,但是我还没有找到。可以通过仔细集成(使用的原始均匀分布)来获得证明,但是它涉及且不够启发。2:12:1Xi


很酷。我很难理解“基于订单统计条件”的含义,是否可以增加直觉?似乎是一种有用的技术。我知道是可交换的,甚至是,这使我们可以考虑任何排列。Xiiid
ekvall 2015年

1
@学生要“有条件”就是说,让我们暂时固定这些值,并考虑可以从中学到什么。稍后,我们将使这些值发生变化(根据其概率分布)。在这种情况下,一旦我们发现答案是而不管订单统计信息的固定值如何,那么我们就不再需要执行更改订单统计信息的第二步。在数学上,订单统计是向量值变量,并且良好指标是,因此2/3 XYE(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.