请解释等待的悖论


75

几年前,我设计了一种辐射探测器,该探测器通过测量事件之间的间隔而不是对事件进行计数来工作。我的假设是,在测量非连续样本时,平均而言,我将测量实际间隔的一半。但是,当我用校准过的信号源测试电路时,读数的因数太高了两个,这意味着我一直在测量整个间隔。

在关于概率和统计的一本旧书中,我找到了关于“等待的悖论”的部分。它提供了一个示例,其中公交车每15分钟到达公交车站,一名乘客随机到达,它表示乘客平均等待整整15分钟。我一直无法理解示例提供的数学知识,并继续寻找解释。如果有人能解释为什么会这样,以便乘客等待整个间隔,我会睡得更好。


1
书名是什么,书的作者是谁?您可以在此处逐字复制示例吗?
Joel Reyes Noche 2014年

这不是我的专长,但是OP所提到的悖论与检查悖论一样吗?
Joel Reyes Noche 2014年


1
我的上述猜测似乎有一定的支持。对这个答案的评论提到了检验悖论。
Joel Reyes Noche 2014年

2
我认为使用公共汽车作为类比是令人困惑的,因为公共汽车倾向于遵循时间表。而是想想一辆空出租车平均每15分钟要到达多长时间。
Harvey Motulsky

Answers:


48

正如Glen_b所指出的那样,如果公交车每分钟一班到达而没有任何不确定性,我们知道最大可能的等待时间是分钟。如果从我们的角度来看,我们是“随机”到达的,那么我们认为“平均”我们将等待最大可能等待时间的一半。在此,最大可能的等待时间等于两次连续到达之间的最大可能长度。表示我们的等待时间和两个连续的公共汽车到达之间的最大长度,我们认为1515WR

(1)E(W)=12R=152=7.5

我们是对的。

但是突然之间我们无法确定,我们被告知现在分钟是两辆公共汽车到站之间的平均时间。我们陷入“直觉性思维陷阱”,并认为:“我们只需要用的期望值代替 ”,我们就认为15R

(2)E(W)=12E(R)=152=7.5WRONG

的第一指示,我们是错误的,是是 “的任何两个连续的母线到达之间的长度”,它是“ 最大长度等”。因此,无论如何,我们都有。RE(R)15

我们如何得出方程?我们认为:“等待时间可以从(1)015

15(2)15E(R)(2)15

因此,也许我们应该计算任意两个连续的公交车到达之间的最大长度的期望值,这是正确的解决方案吗?

f()=λeλ,λ=1/15,E()=15

当然,这是近似的,因为指数分布从右侧获得了无穷的支持,这意味着严格来讲,“所有可能的等待时间”在此建模假设下都包括直至和“包括”无穷大的较大幅度和较大幅度,但概率消失了。

别急,指数是记忆:在什么时间点,无论我们将到达,我们面临着同样的随机变量,无论先发生。

1515


f()fλ()

fX(y)

80

如果公共汽车“每15分钟”到达(即按计划),那么(随机到达)乘客的平均等待时间实际上仅是7.5分钟,因为它将在15分钟的间隔内均匀分配。

-

另一方面,如果公交车以每小时4次的平均速度随机到达(即根据泊松过程),则平均等待时间会更长。确实,您可以通过缺少内存属性来解决此问题。以乘客的到达为起点,下一次事件的时间以指数表示,平均为15分钟。

让我做一个离散的时间类比。想象一下,我正在滚动一个具有15个面的模具,其中一个面被标记为“ B”(对于公共汽车),而14个面被标记为“ X”,以表示那一刻完全没有公共汽车(存在30个侧面骰子,所以我可以标记2个面) 30面模具“ B”的正面)。所以我每分钟滚动一次,看看公交车是否来。骰子没有记忆。它不知道自从上一个“ B”以来已经滚动了多少卷。现在想象一下发生了一些无关紧要的事件-狗吠叫,乘客到达,我听到隆隆的雷声。从现在开始,我要等多长时间(几卷)直到下一个“ B”?

由于内存不足,平均而言,我等待下一个“ B”的时间与两个连续“ B”之间的时间相同。

[接下来,假设我有一个60面的骰子,我每隔15秒钟滚动一次(同样,有一张“ B”字样);现在想象一下,我有一个1000面的骰子,我每0.9秒滚动一次(带有一个“ B”面;或更现实的是,每个10个三面的骰子,如果所有3个面都出现“ 10”,我将结果称为“ B”同时)...等等。在极限条件下,我们得到了连续时间的泊松过程。]

tt

作为老牌的公交车捕手,实际上,现实似乎介于“公交车按时间表到达”和“公交车随机到达”之间。有时(交通状况不佳),您等待一个小时,然后一次到达3个目的地(Zach在下面的评论中指出了原因)。


6
我认为,特别是对于公共汽车,还有一个额外的过程,即当乘客挤进公共汽车时,晚了的公共汽车变得晚了,而后面的空公共汽车最终追赶了(但仍然是空的)。= D
Zach 2014年

4
@Zach的确如此,这就是为什么它们倾向于长期运行,特别是在交通拥挤的情况下。公交车很晚才到我的住处,大约在下一辆公共汽车的时间,他们有时会在沿途的时间准时插入另一辆公共汽车(即,它将没有乘客开车到不远处的公共汽车上时间表,通常是通过较快的路线到达那里),然后开始接载那些现在对他们来说只是有点晚的乘客。同时,很晚巴士现在变成有效的下一个公交车时间表,一旦获得其他公交车来到在。
Glen_b

@Glen_b真是个好主意,哈!
2014年

这是一种有用的防结块策略(至少可以减轻最坏的情况);我不会提出它,除非它涉及到可能需要更精确的公交车等待时间模型处理的依赖问题。
Glen_b 2014年

10

公共汽车上的更多信息。很抱歉在讨论中这么晚才加入对话,但是我最近一直在研究泊松过程...所以在我脑海中浮现之前,这是检查悖论的图形表示:

λθ=1/λ=15

如果我们在调度中心,并且可以在屏幕上看到所有公交车,那么的确,随机挑选多辆公交车,然后平均到后面的公交车的距离,将得出平均到达时间:

在此处输入图片说明

但是,如果我们要做的是只是出现在公交车站(而不是选择公交车),那么我们将在一个典型的早晨沿着公交时刻表的时间进行随机的时间剖面。我们决定在公交车站出现的时间很可能会沿着“箭头”时间均匀地分布。但是,由于距离较远的公交车之间的时间间隔较长,因此我们更有可能最终对这些“散乱者”进行过度采样:

在此处输入图片说明

...因此,我们的等待时间日志不会反映到达时间。这是检验悖论。

15θ=15

E[time waiting (future) + time to last bus departure (past)]=30


在此处输入图片说明


还不清楚吗?-与Legos一起尝试。


优秀的图表。
Glen_b

2

有一个简单的解释,它解决了在给定的平均到达时间(在这种情况下为15分钟)下通过计算通过泊松过程到达的公共汽车的预期等待时间而得出的不同答案,因此,其到达时间为iid指数,平均为15分钟。

方法1)因为泊松过程(指数)是无内存的,所以预期的等待时间为15分钟。

方法2)您同样有可能在到达的到达间隔期间的任何时间到达。因此,期望的等待时间是该到达间隔的期望长度的1/2。这是正确的,并且与方法(1)不冲突。

(1)和(2)怎么都正确?答案是到达您的到达时间的预期间隔时间不是15分钟。实际上是30分钟;30分钟的1/2是15分钟,因此(1)和(2)一致。

为什么到达的到达间隔时间不等于15分钟?这是因为通过首先“固定”到达时间,到达的到达间隔比平均间隔长的可能更长。如果是指数到达间隔时间,则数学计算出来,因此包含您到达时间的到达间隔时间是指数的,是Poisson过程平均到达时间的两倍。

包含到达时间的到达时间的确切分布并不明显,它的均值是两倍的指数,但是经过解释,很明显为什么增加了它。作为一个易于理解的示例,假设到达间隔时间为10分钟(概率为1/2)或20分钟(概率为1/2)。在这种情况下,很可能会出现20分钟长的间隔时间,而很可能是10分钟长的间隔时间,但是当它们确实发生时,它们的持续时间是原来的两倍。因此,一天中2/3的时间点将是到达间隔时间为20分钟的时间。换句话说,如果我们首先选择一个时间,然后想知道包含该时间的到达时间,那么(忽略“白天”开始时的瞬时影响 )该到达时间的预期长度为16 1/3。但是,如果我们首先选择到达时间,然后想知道它的预期长度是15分钟。

更新悖论,长度偏向采样等还有其他变体,几乎是同一件事。

示例1)您有一堆灯泡,寿命随机,但平均为1000小时。当灯泡发生故障时,立即将其替换为另一个灯泡。如果您抽时间去有灯泡的房间,则灯泡在运转时的平均寿命将比1000小时更长。

示例2)如果我们在给定的时间去某个建筑工地,那么到那时在那个地方工作的建筑工人从建筑物上掉下来的平均时间(从他们第一次开始工作起)要比去该工人的平均时间长。从所有开始工作的工人中脱落(从他们刚开始工作时起)。为什么,因为平均工时短至离职的工人比正常工时更有可能已经离职(而不是继续工作),因此正在工作的工人的工时要比平均工时长得多,直到离职为止。

示例3)在城市中随机选择一些适度的人,如果他们参加了城市职业棒球大联盟球队的主场比赛(并非全部售罄),请找出有多少人参加了比赛。然后(在一些稍微理想化但不太合理的假设下),这些游戏的平均出勤率将高于团队所有主场比赛的平均出勤率。为什么?因为参加过高出席率游戏的人比参加低出席率游戏的人更多,所以您选择参加参加过高出席率游戏的人比参加低出席率游戏的人更多。


0

提出的问题是“ ...每15分钟就有一辆公共汽车到达公共汽车站,而一名乘客则随机到达”。如果公共汽车每15分钟一班,那么它不是随机的。它每15分钟到达一次,因此正确答案是7.5分钟。来源被错误地引用或来源的作者草率。

另一方面,辐射探测器听起来像是一个不同的问题,因为辐射事件确实会根据某种分布随机到达,大概是像泊松这样的平均等待时间。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.