一堆飞机事故有多奇怪?


15

原始问题(14/7/25):新闻媒体的这句话是否有意义,或者是否有更好的统计方法来查看最近发生的飞机意外事件?

但是,巴内特(Barnett)也提请注意泊松分布的理论,这意味着两次碰撞之间的短暂间隔实际上比长时间碰撞更可能发生。

巴内特说:“假设每年平均发生一次致命事故,这意味着在任何一天发生车祸的可能性是365分之一。” “如果8月1日发生崩溃,则下次崩溃发生在8月2日一天之后的机会是1/365。但是下次崩溃发生在8月3日发生的机会是(364/365)x(1/365) ,因为只有在8月2日没有崩溃的情况下,下一次崩溃才会在8月3日发生。”

巴内特说:“这似乎是违反直觉的,但结论是无条件地根据概率定律得出的。”

资料来源:http : //www.bbc.com/news/magazine-28481060

说明性(14/7/27):(对我而言)反直觉的是,罕见事件往往会在很短的时间内发生。凭直觉,我认为罕见事件不会及时发生。有人能指出泊松分布假设下事件之间时间的理论或经验预期分布吗?(即,直方图,其中y轴是频率或概率,x轴是两次连续出现之间的时间,分为2天,数周,数月或数年等。)谢谢。

澄清(7/28/14):标题暗示比起广泛分布的事故,它更有可能发生事故簇。让我们对其进行操作。假设一个集群是3起飞机事故,短时间是3个月,长时间是3年。认为在3个月内发生3次事故的可能性比3年内发生事故的可能性更高,这似乎是不合逻辑的。即使我们将第一起事故定为自然事件,但认为未来3个月内与未来3年内还会再发生2起事故是不合逻辑的。如果这是真的,那么新闻媒体的标题就是误导和不正确的。我想念什么吗?


1
重新说明一下:区分概率每单位时间的概率期望值可能会有所帮助。尽管描述稀有事件的过程(实际上是“稀有”的含义)在事件之间具有较长的预期时间,但这并不与单位时间一开始出现的最大概率不一致。尽管如此,事件在短时间内发生的可能性很小。
ub

2
另外,我刚刚注意到这篇Wikipedia文章 -您可能会喜欢。哦,我也刚看过这个pdf文件,它特别提到了飞机坠毁的“聚类”(并且比我到目前为止所描述的问题要好得多……)。
史蒂夫·S

1
@Glen_b:报纸文章的缺陷(隐含在文章标题中,这是我发帖的标题)是,该文章表明,在一定数量(即一组)中发生事故的可能性更高较短的时间比较长的时间更长。那是错误的。
乔尔W.

1
@JoelW .:如果有什么话,那将是记者搞砸了……无论如何,一切都清理了还是您还有任何保留意见?
史蒂夫·S

1
我的猜测是误导记者的是统计学家。我怀疑记者自己是错的(因为这很违反直觉)。
Joel W.

Answers:


3

摘要:BBC引用的段落中的第一句草率且具有误导性。

尽管先前的答案和评论已经进行了精彩的讨论,但我仍觉得主要问题并未得到令人满意的回答。

因此,让我们假设在任何一天飞机失事的概率为,而且崩溃是相互独立的。让我们进一步假设一架飞机在1月1日坠毁。下一架飞机何时会坠毁?p=1/365

好吧,让我们做一个简单的模拟:接下来三年中的每一天,我将随机决定是否有另一架飞机以概率坠毁,并记下下次坠毁的日期;我将重复此过程100p次 这是结果直方图:100000

飞机压碎的分布,模型

实际上,概率分布可以简单地由,其中t是天数。我将该理论分布绘制为一条红线,您可以看到它与蒙特卡罗直方图非常吻合。备注:如果时间在越来越小的仓中离散化,则这种分布将收敛到指数级;但这与讨论无关紧要。Pr(t)=(1p)tpt

正如许多人已经在这里指出的那样,这是一条递减的曲线。这意味着下一架飞机在第二天(1月2日)坠毁的概率高于下一架飞机在任何给定的一天(例如,明年1月2日)坠毁的概率(相差几乎三倍:0.10 )。0.27%0.10%

0.8%94% 这就是为什么即使单调递减的概率分布,也很可能不会出现“团簇”(例如三天内两次飞机坠毁)。

这是另一个直方图,可以真正说明这一点。它只是几个不相交时间段内先前直方图的总和:

飞机直击频率直方图


您是说麻省理工学院的教授错了吗?
史蒂夫S

1
不,BBC文章中Barnett的报价是完全正确的。但是BBC记者对此的解释充其量是松懈的:“巴内特(Barnett)也提请注意泊松分布的理论,这意味着两次碰撞之间的短暂间隔实际上比长时间碰撞更可能发生”。对这句话的最自然的解释是完全错误的(我想巴内特并不是要暗示这一点)。也许我应该在答复中对此更加明确。您是否同意我的回答中的大部分内容?希望不会,因为我完全同意您的看法。
变形虫说恢复莫妮卡2014年

13

记者说的是,飞机失事的随机发生可以被建模为泊松过程-一种情况,在某个(较小)间隔内发生事件的概率与所述间隔的长度成正比,并且每次发生在独立的所有其他人。

对于所描述的场景,这是否是一个合理的模型?

大概。

当然,这些事件可能不是100%独立的,因为其他飞行员在撞机后可能会改变其行为(如果只是非常轻微的话)。[我不知道-也许一些飞行员会做一些额外的模拟器培训或类似的工作]。尽管如此,独立的假设仍然是完全合理的。

那群飞机失事呢?

是。给定泊松过程(或什至是其他随机过程),您可能希望看到一些事件簇。

实际上,正如《牛津统计学词典》在其泊松过程条目(这是对“随机性的数学描述”)中所述:

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

例如,查看以下简单的R代码:

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

产生:
注意结块吗?

即使我们知道这是一个随机点图,它看起来也似乎有一些随机位-特别是,在该图的某些部分中,有成簇的点,而其他部分则是敞开的。本文试图描述的是这种行为(仅针对时间序列数据,而非空间数据)。


更新:

@JoelW .:因此,例如,假设一架飞机明天(或该日的任何一天)坠毁的机率是“ p ”(并且说“ p ”是百分之一)。

之所以接下来的飞机失事是更可能发生,明天比它更可能整整一年发生的(即年7月26 到2015年),是因为下一次危机是在整整一年的概率等于:

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

合理?

最后,我认为,这些东西都是反直觉的原因是因为通常当我们看待一个短语:"The odds of a plane crash in one month compared with the odds of one happening tomorrow"。我们自然不会立即考虑恰好在一个月内开始的24小时周期。相反,我们(或者至少是我)倾向于更多,更好,更灵活地考虑它。所以更喜欢:a month ± a week。那就是我们忘记考虑过渡期间未发生崩溃的可能性的事实 ……(但再次,也许就是我……)。


其他资源:

  • 维基百科有关聚类错觉的文章
  • 一份pdf文件专门提到了飞机失事的“聚类”(第8页),并简要介绍了Poisson过程的数学原理

1
@Joel W .:实际上,我应该在此答案中加上更多内容-给我几分钟编辑...
Steve S

7
关于延误旅行的说法与关于TSA如何在飞机上发现炸弹的统计学家的老笑话中出现的说法相同。当被问及解释时,统计学家说:“嗯,一个人拥有炸弹的几率很小但还不够舒适,但是两个人拥有炸弹的几率很小。因此,当携带炸弹时,几乎没有机会会有两枚炸弹,我们将绝对安全。”
ub

1
您的笑话很直白,@ whuber,但是在说“两次碰撞之间的短暂间隔实际上比长距离间隔更可能发生”与说明天发生碰撞的可能性与是否发生碰撞无关,这之间似乎存在某种逻辑上的脱节。发生在今天。我猜概率可能是违反直觉的。
Joel W.

1
(对我而言)与直觉相反的是,罕见事件往往会在很短的时间内发生。凭直觉,我认为罕见事件不会及时发生。我是唯一拥有这种直观视图的人吗?
Joel W.

1
@Steve S:谢谢您的链接。新闻文章(1/365)中的假定值的指数分布是什么样的?无论如何,指数分布可能无法解决文章的标题问题,这意味着将给定数量的事件在很短时间内发生的概率与该事件的数量在很长一段时间内发生的概率进行比较。
Joel W.

4

如果飞机坠毁的次数是泊松分布(正如他似乎所说的),则两次坠落之间的时间呈指数分布。指数分布的pdf是时间的单调递减函数。因此,较早的崩溃比以后的崩溃更有可能。


“两次撞机之间的时间间隔实际上比长途撞机的可能性大”与说如果刚发生了飞机撞机事件,我们所有人都应该推迟即将到来的旅行(出于统计原因)有什么不同?
Joel W.

2
乔尔(Joel),直到它的作者量化了“空头”和“多头”的意思之前,这句话才是毫无意义的。以他的预期为每年一次的事件为例,下个月再次发生的机会仍然远远少于一年后发生下一次崩溃的机会。他可能的意思是,近期内每单位时间概率要比长期内更高。要比较实际概率,您必须将单位时间的概率乘以持续时间(从技术上讲,您必须在持续时间内对它进行积分)。
ub

@whuber:头条新闻谈到了一系列飞机事故的可能性。到目前为止,关于stackexchange的任何事情都没有说服我相信,与广泛分布的飞机事故相比,一连串的飞机事故更普遍或更可能发生。因此,在我看来,新闻媒体的报价完全是误导性的(可能是因为您所写的时间间隔未确定)。你怎么看?
Joel W.

我不知道您所说的“大范围飞机事故”是什么意思,因此,我完全不确定您理解的是什么“集群”。假设为使情况具体,在0、10、11、12和22年发生了一系列罕见事件(从某个初始日期开始计算)。究竟发生了多少次“间隔较大”的事件?发生了多少个“集群”?我可以找到第一个问题的合理答案,范围从零到十,第二个问题的答案可以是零或一个。
ub

1
@whuber:标题暗示比起分散的事故,它更有可能发生事故。让我们对其进行操作。假设一个集群是3架飞机事故,短时间是3个月,长时间是3年。认为在3个月内发生3次事故的可能性比3年内发生事故的可能性更高,这似乎是不合逻辑的。即使我们将第一起事故视为理所当然,但认为未来3个月内与未来3年内还会再发生2起事故是不合逻辑的。
Joel W.

0

其他答案已经涉及到独立事件如何聚集。(这些年前读格里克的《混沌》,使我对这个想法大开眼界。)

但是,实际上,有充分的证据表明飞机坠毁不是独立事件。恰尔迪尼的影响力在这方面有非常好的一章(这里也提到它与数据的一些链接;我发现了本书那部分的摘录)。显然,这是一个极富争议的话题:基本上是说,空难越受关注,就越有可能影响飞行员(有意或无意)使飞机坠毁。但是,假说背后的心理学解释似乎是合理的,数据似乎也支持了这一假设。

(在评论中,欢迎链接到基于统计的揭穿研究。)


没这么说:说:“紧跟着某些广为流传的自杀故事,死于商业航空公司坠机事故的人数有所增加”。
Scortchi-恢复莫妮卡

索赔的参考,我认为,菲利普斯,(1978)“飞机事故死亡人数增加只是谋杀和自杀的新闻报道后”,科学201,页748-750。摘要是指“私人,商务和公司执行飞机”。
Scortchi-恢复莫妮卡

或者,也许这一个:菲利普斯(1980年),“飞机事故,谋杀,和大众媒体:朝模仿和建议的理论”,社会力量58,4,其中“航空公司”在抽象中提到。
Scortchi-恢复莫妮卡

2
Altheide(1981),《社会力量》,第60期,第2期指出,“某些广为流传的自杀故事”可能并没有完全独立于随后的“飞机失事”而定义-听起来更像是“著名拉比”的定义。
Scortchi-恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.